Warcbase
A lap korábbi változatát látod, amilyen Admin (vitalap | szerkesztései) 2019. július 19., 22:17-kor történt szerkesztése után volt.
A kanadai University of Waterloo szakemberei által Java-ban fejlesztett, scriptelhető és jól skálázható open-source eszköz Hadoop keretrendszeren webarchívumok tartalmának menedzseléséhez, a WARC/ARC fájlokból adatok kinyeréséhez (pl. linkek, nyers szövegek), melyek azután továbbadhatók különböző kereső, elemző és vizualizáló programoknak. Folytatása az Archives Unleashed Toolkit.