„Warcbase” változatai közötti eltérés
(Új oldal, tartalma: „A kanadai University of Waterloo szakemberei által Java-ban fejlesztett, scriptelhető és jól skálázható open-source eszköz Hadoop keretrendszeren webarchív…”) |
|||
1. sor: | 1. sor: | ||
− | A kanadai University of Waterloo szakemberei által Java-ban fejlesztett, scriptelhető és jól skálázható open-source eszköz [[Hadoop]] keretrendszeren webarchívumok tartalmának menedzseléséhez, a [[WARC]]/[[ARC]] fájlokból adatok kinyeréséhez (pl. linkek, nyers szövegek), melyek azután továbbadhatók különböző kereső, elemző és vizualizáló programoknak. |
+ | A kanadai University of Waterloo szakemberei által Java-ban fejlesztett, scriptelhető és jól skálázható open-source eszköz [[Hadoop]] keretrendszeren webarchívumok tartalmának menedzseléséhez, a [[WARC]]/[[ARC]] fájlokból adatok kinyeréséhez (pl. linkek, nyers szövegek), melyek azután továbbadhatók különböző kereső, elemző és vizualizáló programoknak. Folytatása az [[Archives Unleashed Toolkit]]. |
---- |
---- |
A lap jelenlegi, 2019. július 19., 22:17-kori változata
A kanadai University of Waterloo szakemberei által Java-ban fejlesztett, scriptelhető és jól skálázható open-source eszköz Hadoop keretrendszeren webarchívumok tartalmának menedzseléséhez, a WARC/ARC fájlokból adatok kinyeréséhez (pl. linkek, nyers szövegek), melyek azután továbbadhatók különböző kereső, elemző és vizualizáló programoknak. Folytatása az Archives Unleashed Toolkit.