„Heritrix” változatai közötti eltérés
(Új oldal, tartalma: „Az Internet Archive által Java-ban írt webarchiváló szabad szoftver Linuxra (Windows alatt is megy, de az nem támogatott). Parancsmódban működik (bár léte…”) |
|||
1. sor: | 1. sor: | ||
− | Az [[Internet Archive]] által Java-ban írt webarchiváló szabad szoftver Linuxra (Windows alatt is megy, de az nem támogatott). Parancsmódban működik (bár létezik egy [[WAIL]] nevű GUI is hozzá), rengeteg konfigurálási lehetőséggel, a letöltött fájlokat [[WARC]] csomagokban tárolja, de tud menteni az eredeti fájlstruktúrát megőrizve is. A legtöbb nagy webarchívum ezt a [[crawler]]t használja aratásra jelenleg. |
+ | Az [[Internet Archive]] által 2002 óta fejlesztett, Java-ban írt webarchiváló szabad szoftver Linuxra (Windows alatt is megy, de az nem támogatott). Parancsmódban működik (bár létezik egy [[WAIL]] nevű GUI is hozzá), rengeteg konfigurálási lehetőséggel, a letöltött fájlokat [[WARC]] csomagokban tárolja, de tud menteni az eredeti fájlstruktúrát megőrizve is. A legtöbb nagy webarchívum ezt a [[crawler]]t használja aratásra jelenleg. |
---- |
---- |
||
+ | * [https://github.com/internetarchive/heritrix3 A Heritrix a GitHub-on] |
||
− | * [http://crawler.archive.org Heritrix honlap (nem frissül)] |
||
* [https://webarchive.jira.com/wiki/display/Heritrix Heritrix Wiki] |
* [https://webarchive.jira.com/wiki/display/Heritrix Heritrix Wiki] |
||
+ | * [http://web.archive.org/web/20111019070009/http://crawler.archive.org:80/ A Heritrix 2011-ben archivált régi honlapja] |
||
* [https://en.wikipedia.org/wiki/Heritrix Wikipedia: Heritrix] |
* [https://en.wikipedia.org/wiki/Heritrix Wikipedia: Heritrix] |
||
A lap 2017. szeptember 23., 14:06-kori változata
Az Internet Archive által 2002 óta fejlesztett, Java-ban írt webarchiváló szabad szoftver Linuxra (Windows alatt is megy, de az nem támogatott). Parancsmódban működik (bár létezik egy WAIL nevű GUI is hozzá), rengeteg konfigurálási lehetőséggel, a letöltött fájlokat WARC csomagokban tárolja, de tud menteni az eredeti fájlstruktúrát megőrizve is. A legtöbb nagy webarchívum ezt a crawlert használja aratásra jelenleg.