Warcbase

Innen: MIA

A kanadai University of Waterloo szakemberei által Java-ban fejlesztett, scriptelhető és jól skálázható open-source eszköz Hadoop keretrendszeren webarchívumok tartalmának menedzseléséhez, a WARC/ARC fájlokból adatok kinyeréséhez (pl. linkek, nyers szövegek), melyek azután továbbadhatók különböző kereső, elemző és vizualizáló programoknak. Folytatása az Archives Unleashed Toolkit.