„Heritrix” változatai közötti eltérés

Innen: MIA
4. sor: 4. sor:
   
 
* [https://github.com/internetarchive/heritrix3 A Heritrix a GitHub-on]
 
* [https://github.com/internetarchive/heritrix3 A Heritrix a GitHub-on]
* [https://github.com/internetarchive/heritrix3/wiki]
+
* [https://github.com/internetarchive/heritrix3/wiki Heritrix wiki]
 
* [http://web.archive.org/web/20111019070009/http://crawler.archive.org:80/ A Heritrix 2011-ben archivált régi honlapja]
 
* [http://web.archive.org/web/20111019070009/http://crawler.archive.org:80/ A Heritrix 2011-ben archivált régi honlapja]
 
* [https://en.wikipedia.org/wiki/Heritrix Wikipedia: Heritrix]
 
* [https://en.wikipedia.org/wiki/Heritrix Wikipedia: Heritrix]

A lap 2018. szeptember 28., 09:41-kori változata

Az Internet Archive által 2003 óta fejlesztett, Java-ban írt webarchiváló szabad szoftver Linuxra (Windows alatt is megy, de az nem támogatott). Parancsmódban működik (bár létezik egy WAIL nevű GUI is hozzá), rengeteg konfigurálási lehetőséggel, a letöltött fájlokat WARC csomagokban tárolja, de tud menteni az eredeti fájlstruktúrát megőrizve is. A legtöbb nagy webarchívum ezt a crawlert használja aratásra jelenleg.