„Heritrix” változatai közötti eltérés
7. sor: | 7. sor: | ||
* [http://web.archive.org/web/20111019070009/http://crawler.archive.org:80/ A Heritrix 2011-ben archivált régi honlapja] |
* [http://web.archive.org/web/20111019070009/http://crawler.archive.org:80/ A Heritrix 2011-ben archivált régi honlapja] |
||
* [https://en.wikipedia.org/wiki/Heritrix Wikipedia: Heritrix] |
* [https://en.wikipedia.org/wiki/Heritrix Wikipedia: Heritrix] |
||
+ | * [https://juzraai.github.io/blog/2013/heritrix-3-konfig-receptkonyv/ Jurányi Zsolt: Heritrix 3 konfig receptkönyv] |
||
[[Category:SZOFTVEREK]] |
[[Category:SZOFTVEREK]] |
A lap jelenlegi, 2018. szeptember 28., 10:06-kori változata
Az Internet Archive által 2003 óta fejlesztett, Java-ban írt webarchiváló szabad szoftver Linuxra (Windows alatt is megy, de az nem támogatott). Parancsmódban működik (bár létezik egy WAIL nevű GUI is hozzá), rengeteg konfigurálási lehetőséggel, a letöltött fájlokat WARC csomagokban tárolja, de tud menteni az eredeti fájlstruktúrát megőrizve is. A legtöbb nagy webarchívum ezt a crawlert használja aratásra jelenleg.