PANDORA (ausztrál)
(Preserving and Accessing Networked Documentary Resources of Australia)
A National Library of Australia által 1996-ban indított, konzorciális munkamegosztással működő webarchiváló projekt. A saját fejlesztésű PANDAS keretrendszert használják az archívum menedzselésére (Java-programok, Oracle adatkezelő és HTTrack letöltő). Emellett Heritrixet, illetve Webrecorder keretrendszerben PyWb és Warcprox szoftvereket is használnak. A Pandas mellett a Heritrixszel begyűjtött gyűjtemény gondozása a Bamboo keretrendszerben zajlik. Nemcsak komplett webhelyeket, hanem egyedi online dokumentumokat/dokumentumcsoportokat is archiválnak. 2000-re 600, 2008-ra 17,900, 2014-re 37,000, 2016 októberéig pedig 48,233 címet mentettek le legalább egyszer (a tárhelyigény ekkor 25.66 TB volt). Szelektív archiválást folytatnak, elsődlegesen a kormányzati, tudományos és kulturális tartalmat gyűjtik. Az archívum nagy része nyilvános és visszakereshető a könyvtári katalógusokban, sőt a nemzeti bibliográfiába is bekerül. Minden lementett tartalom (egészen fájlszintig lemenően) stabil azonosítót kap.
Az Internet Archive segítségével 2005 óta a teljes .au domain-t is aratják évente, de ezt az anyagot nem szolgáltatják jogi okokból, kutatók kérhetnek csak hozzáférést. Ennek mérete 2008-ban: 3 millió site, 1 milliárd fájl, 34.55 terabájt.
2019-ben a webarchívumot elérhetővé és kereshetővé tették a nemzeti könyvtár digitális dokumentumgyűjteményét kezelő Trove rendszerben is. Az erről szóló márciusi hír szerint ekkor az archívum mérete mintegy 9 milliárd rekord (fájl?) volt, 600 terabájt összméretben.
- Wikipedia: Pandora Archive
- PANDORA honlap
- Australian Web Domain Harvests
- A Pandora és egyéb ausztrál webarchiváló projektek ismertetése
- Az NLA "Preserving Access to Digital Information" (PADI) nevű tematikus honlapjának mentései a PANDORA-ban
- Trove - Australian web archive
- Bamboo - heritrix alapú gyűjtemények keretrendszere