„PANDORA (ausztrál)” változatai közötti eltérés
1. sor: | 1. sor: | ||
= (Preserving and Accessing Networked Documentary Resources of Australia) = |
= (Preserving and Accessing Networked Documentary Resources of Australia) = |
||
− | A National Library of Australia által 1996-ban indított, konzorciális munkamegosztással működő webarchiváló projekt. A saját fejlesztésű [[PANDAS]] keretrendszert használják az archívum menedzselésére (Java-programok, Oracle adatkezelő és [[HTTrack]] letöltő). Nemcsak komplett webhelyeket, hanem egyedi online dokumentumokat/dokumentumcsoportokat is archiválnak. 2000-re 600, 2008-ra 17,900, 2014-re 37,000, 2016 októberéig pedig 48,233 címet mentettek le legalább egyszer (a tárhelyigény ekkor 25.66 TB volt). Szelektív archiválást folytatnak, elsődlegesen a kormányzati, tudományos és kulturális tartalmat gyűjtik. Az archívum nagy része nyilvános és visszakereshető a könyvtári katalógusokban, sőt a nemzeti bibliográfiába is bekerül. Minden lementett tartalom (egészen fájlszintig lemenően) stabil azonosítót kap. |
+ | A National Library of Australia által 1996-ban indított, konzorciális munkamegosztással működő webarchiváló projekt. A saját fejlesztésű [[PANDAS]] keretrendszert használják az archívum menedzselésére (Java-programok, Oracle adatkezelő és [[HTTrack]] letöltő). Emellett Heritrixet, illetve Webrecorder keretrendszerben PyWb és Warcprox szoftvereket is használnak. A Pandas mellett a Heritrixszel begyűjtött gyűjtemény gondozása a Bamboo keretrendszerben zajlik. Nemcsak komplett webhelyeket, hanem egyedi online dokumentumokat/dokumentumcsoportokat is archiválnak. 2000-re 600, 2008-ra 17,900, 2014-re 37,000, 2016 októberéig pedig 48,233 címet mentettek le legalább egyszer (a tárhelyigény ekkor 25.66 TB volt). Szelektív archiválást folytatnak, elsődlegesen a kormányzati, tudományos és kulturális tartalmat gyűjtik. Az archívum nagy része nyilvános és visszakereshető a könyvtári katalógusokban, sőt a nemzeti bibliográfiába is bekerül. Minden lementett tartalom (egészen fájlszintig lemenően) stabil azonosítót kap. |
Az [[Internet Archive]] segítségével 2005 óta a teljes .au domain-t is aratják évente, de ezt az anyagot nem szolgáltatják jogi okokból, kutatók kérhetnek csak hozzáférést. Ennek mérete 2008-ban: 3 millió site, 1 milliárd fájl, 34.55 terabájt. |
Az [[Internet Archive]] segítségével 2005 óta a teljes .au domain-t is aratják évente, de ezt az anyagot nem szolgáltatják jogi okokból, kutatók kérhetnek csak hozzáférést. Ennek mérete 2008-ban: 3 millió site, 1 milliárd fájl, 34.55 terabájt. |
||
15. sor: | 15. sor: | ||
* [http://pandora.nla.gov.au/tep/10691 Az NLA "Preserving Access to Digital Information" (PADI) nevű tematikus honlapjának mentései a PANDORA-ban] |
* [http://pandora.nla.gov.au/tep/10691 Az NLA "Preserving Access to Digital Information" (PADI) nevű tematikus honlapjának mentései a PANDORA-ban] |
||
* [https://trove.nla.gov.au/website?q= Trove - Australian web archive] |
* [https://trove.nla.gov.au/website?q= Trove - Australian web archive] |
||
+ | * [https://github.com/nla/bamboo Bamboo - heritrix alapú gyűjtemények keretrendszere] |
||
[[Category:PROJEKTEK]] |
[[Category:PROJEKTEK]] |
A lap jelenlegi, 2020. október 12., 12:30-kori változata
(Preserving and Accessing Networked Documentary Resources of Australia)
A National Library of Australia által 1996-ban indított, konzorciális munkamegosztással működő webarchiváló projekt. A saját fejlesztésű PANDAS keretrendszert használják az archívum menedzselésére (Java-programok, Oracle adatkezelő és HTTrack letöltő). Emellett Heritrixet, illetve Webrecorder keretrendszerben PyWb és Warcprox szoftvereket is használnak. A Pandas mellett a Heritrixszel begyűjtött gyűjtemény gondozása a Bamboo keretrendszerben zajlik. Nemcsak komplett webhelyeket, hanem egyedi online dokumentumokat/dokumentumcsoportokat is archiválnak. 2000-re 600, 2008-ra 17,900, 2014-re 37,000, 2016 októberéig pedig 48,233 címet mentettek le legalább egyszer (a tárhelyigény ekkor 25.66 TB volt). Szelektív archiválást folytatnak, elsődlegesen a kormányzati, tudományos és kulturális tartalmat gyűjtik. Az archívum nagy része nyilvános és visszakereshető a könyvtári katalógusokban, sőt a nemzeti bibliográfiába is bekerül. Minden lementett tartalom (egészen fájlszintig lemenően) stabil azonosítót kap.
Az Internet Archive segítségével 2005 óta a teljes .au domain-t is aratják évente, de ezt az anyagot nem szolgáltatják jogi okokból, kutatók kérhetnek csak hozzáférést. Ennek mérete 2008-ban: 3 millió site, 1 milliárd fájl, 34.55 terabájt.
2019-ben a webarchívumot elérhetővé és kereshetővé tették a nemzeti könyvtár digitális dokumentumgyűjteményét kezelő Trove rendszerben is. Az erről szóló márciusi hír szerint ekkor az archívum mérete mintegy 9 milliárd rekord (fájl?) volt, 600 terabájt összméretben.
- Wikipedia: Pandora Archive
- PANDORA honlap
- Australian Web Domain Harvests
- A Pandora és egyéb ausztrál webarchiváló projektek ismertetése
- Az NLA "Preserving Access to Digital Information" (PADI) nevű tematikus honlapjának mentései a PANDORA-ban
- Trove - Australian web archive
- Bamboo - heritrix alapú gyűjtemények keretrendszere