„Heritrix” változatai közötti eltérés
(Új oldal, tartalma: „Az Internet Archive által Java-ban írt webarchiváló szabad szoftver Linuxra (Windows alatt is megy, de az nem támogatott). Parancsmódban működik (bár léte…”) |
|||
(4 közbenső módosítás ugyanattól a szerkesztőtől nincs mutatva) | |||
1. sor: | 1. sor: | ||
− | Az [[Internet Archive]] által Java-ban írt webarchiváló szabad szoftver Linuxra (Windows alatt is megy, de az nem támogatott). Parancsmódban működik (bár létezik egy [[WAIL]] nevű GUI is hozzá), rengeteg konfigurálási lehetőséggel, a letöltött fájlokat [[WARC]] csomagokban tárolja, de tud menteni az eredeti fájlstruktúrát megőrizve is. A legtöbb nagy webarchívum ezt a [[crawler]]t használja aratásra jelenleg. |
+ | Az [[Internet Archive]] által 2003 óta fejlesztett, Java-ban írt webarchiváló szabad szoftver Linuxra (Windows alatt is megy, de az nem támogatott). Parancsmódban működik (bár létezik egy [[WAIL]] nevű GUI is hozzá), rengeteg konfigurálási lehetőséggel, a letöltött fájlokat [[WARC]] csomagokban tárolja, de tud menteni az eredeti fájlstruktúrát megőrizve is. A legtöbb nagy webarchívum ezt a [[crawler]]t használja aratásra jelenleg. |
---- |
---- |
||
+ | * [https://github.com/internetarchive/heritrix3 A Heritrix a GitHub-on] |
||
− | * [http://crawler.archive.org Heritrix honlap (nem frissül)] |
||
− | * [https:// |
+ | * [https://github.com/internetarchive/heritrix3/wiki Heritrix wiki] |
+ | * [http://web.archive.org/web/20111019070009/http://crawler.archive.org:80/ A Heritrix 2011-ben archivált régi honlapja] |
||
* [https://en.wikipedia.org/wiki/Heritrix Wikipedia: Heritrix] |
* [https://en.wikipedia.org/wiki/Heritrix Wikipedia: Heritrix] |
||
+ | * [https://juzraai.github.io/blog/2013/heritrix-3-konfig-receptkonyv/ Jurányi Zsolt: Heritrix 3 konfig receptkönyv] |
||
[[Category:SZOFTVEREK]] |
[[Category:SZOFTVEREK]] |
A lap jelenlegi, 2018. szeptember 28., 10:06-kori változata
Az Internet Archive által 2003 óta fejlesztett, Java-ban írt webarchiváló szabad szoftver Linuxra (Windows alatt is megy, de az nem támogatott). Parancsmódban működik (bár létezik egy WAIL nevű GUI is hozzá), rengeteg konfigurálási lehetőséggel, a letöltött fájlokat WARC csomagokban tárolja, de tud menteni az eredeti fájlstruktúrát megőrizve is. A legtöbb nagy webarchívum ezt a crawlert használja aratásra jelenleg.