„Heritrix” változatai közötti eltérés
4. sor: | 4. sor: | ||
* [https://github.com/internetarchive/heritrix3 A Heritrix a GitHub-on] |
* [https://github.com/internetarchive/heritrix3 A Heritrix a GitHub-on] |
||
− | * [https:// |
+ | * [https://github.com/internetarchive/heritrix3/wiki] |
* [http://web.archive.org/web/20111019070009/http://crawler.archive.org:80/ A Heritrix 2011-ben archivált régi honlapja] |
* [http://web.archive.org/web/20111019070009/http://crawler.archive.org:80/ A Heritrix 2011-ben archivált régi honlapja] |
||
* [https://en.wikipedia.org/wiki/Heritrix Wikipedia: Heritrix] |
* [https://en.wikipedia.org/wiki/Heritrix Wikipedia: Heritrix] |
A lap 2018. szeptember 28., 09:41-kori változata
Az Internet Archive által 2003 óta fejlesztett, Java-ban írt webarchiváló szabad szoftver Linuxra (Windows alatt is megy, de az nem támogatott). Parancsmódban működik (bár létezik egy WAIL nevű GUI is hozzá), rengeteg konfigurálási lehetőséggel, a letöltött fájlokat WARC csomagokban tárolja, de tud menteni az eredeti fájlstruktúrát megőrizve is. A legtöbb nagy webarchívum ezt a crawlert használja aratásra jelenleg.