„Warcbase” változatai közötti eltérés

Innen: MIA
(Új oldal, tartalma: „A kanadai University of Waterloo szakemberei által Java-ban fejlesztett, scriptelhető és jól skálázható open-source eszköz Hadoop keretrendszeren webarchív…”)
 
 
1. sor: 1. sor:
A kanadai University of Waterloo szakemberei által Java-ban fejlesztett, scriptelhető és jól skálázható open-source eszköz [[Hadoop]] keretrendszeren webarchívumok tartalmának menedzseléséhez, a [[WARC]]/[[ARC]] fájlokból adatok kinyeréséhez (pl. linkek, nyers szövegek), melyek azután továbbadhatók különböző kereső, elemző és vizualizáló programoknak.
+
A kanadai University of Waterloo szakemberei által Java-ban fejlesztett, scriptelhető és jól skálázható open-source eszköz [[Hadoop]] keretrendszeren webarchívumok tartalmának menedzseléséhez, a [[WARC]]/[[ARC]] fájlokból adatok kinyeréséhez (pl. linkek, nyers szövegek), melyek azután továbbadhatók különböző kereső, elemző és vizualizáló programoknak. Folytatása az [[Archives Unleashed Toolkit]].
   
 
----
 
----

A lap jelenlegi, 2019. július 19., 22:17-kori változata

A kanadai University of Waterloo szakemberei által Java-ban fejlesztett, scriptelhető és jól skálázható open-source eszköz Hadoop keretrendszeren webarchívumok tartalmának menedzseléséhez, a WARC/ARC fájlokból adatok kinyeréséhez (pl. linkek, nyers szövegek), melyek azután továbbadhatók különböző kereső, elemző és vizualizáló programoknak. Folytatása az Archives Unleashed Toolkit.