„PANDORA (ausztrál)” változatai közötti eltérés

Innen: MIA
 
1. sor: 1. sor:
 
= (Preserving and Accessing Networked Documentary Resources of Australia) =
 
= (Preserving and Accessing Networked Documentary Resources of Australia) =
   
A National Library of Australia által 1996-ban indított, konzorciális munkamegosztással működő webarchiváló projekt. A saját fejlesztésű [[PANDAS]] keretrendszert használják az archívum menedzselésére (Java-programok, Oracle adatkezelő és [[HTTrack]] letöltő). Nemcsak komplett webhelyeket, hanem egyedi online dokumentumokat/dokumentumcsoportokat is archiválnak. 2000-re 600, 2008-ra 17,900, 2014-re 37,000, 2016 októberéig pedig 48,233 címet mentettek le legalább egyszer (a tárhelyigény ekkor 25.66 TB volt). Szelektív archiválást folytatnak, elsődlegesen a kormányzati, tudományos és kulturális tartalmat gyűjtik. Az archívum nagy része nyilvános és visszakereshető a könyvtári katalógusokban, sőt a nemzeti bibliográfiába is bekerül. Minden lementett tartalom (egészen fájlszintig lemenően) stabil azonosítót kap.
+
A National Library of Australia által 1996-ban indított, konzorciális munkamegosztással működő webarchiváló projekt. A saját fejlesztésű [[PANDAS]] keretrendszert használják az archívum menedzselésére (Java-programok, Oracle adatkezelő és [[HTTrack]] letöltő). Emellett Heritrixet, illetve Webrecorder keretrendszerben PyWb és Warcprox szoftvereket is használnak. A Pandas mellett a Heritrixszel begyűjtött gyűjtemény gondozása a Bamboo keretrendszerben zajlik. Nemcsak komplett webhelyeket, hanem egyedi online dokumentumokat/dokumentumcsoportokat is archiválnak. 2000-re 600, 2008-ra 17,900, 2014-re 37,000, 2016 októberéig pedig 48,233 címet mentettek le legalább egyszer (a tárhelyigény ekkor 25.66 TB volt). Szelektív archiválást folytatnak, elsődlegesen a kormányzati, tudományos és kulturális tartalmat gyűjtik. Az archívum nagy része nyilvános és visszakereshető a könyvtári katalógusokban, sőt a nemzeti bibliográfiába is bekerül. Minden lementett tartalom (egészen fájlszintig lemenően) stabil azonosítót kap.
   
 
Az [[Internet Archive]] segítségével 2005 óta a teljes .au domain-t is aratják évente, de ezt az anyagot nem szolgáltatják jogi okokból, kutatók kérhetnek csak hozzáférést. Ennek mérete 2008-ban: 3 millió site, 1 milliárd fájl, 34.55 terabájt.
 
Az [[Internet Archive]] segítségével 2005 óta a teljes .au domain-t is aratják évente, de ezt az anyagot nem szolgáltatják jogi okokból, kutatók kérhetnek csak hozzáférést. Ennek mérete 2008-ban: 3 millió site, 1 milliárd fájl, 34.55 terabájt.
15. sor: 15. sor:
 
* [http://pandora.nla.gov.au/tep/10691 Az NLA "Preserving Access to Digital Information" (PADI) nevű tematikus honlapjának mentései a PANDORA-ban]
 
* [http://pandora.nla.gov.au/tep/10691 Az NLA "Preserving Access to Digital Information" (PADI) nevű tematikus honlapjának mentései a PANDORA-ban]
 
* [https://trove.nla.gov.au/website?q= Trove - Australian web archive]
 
* [https://trove.nla.gov.au/website?q= Trove - Australian web archive]
  +
* [https://github.com/nla/bamboo Bamboo - heritrix alapú gyűjtemények keretrendszere]
   
 
[[Category:PROJEKTEK]]
 
[[Category:PROJEKTEK]]

A lap jelenlegi, 2020. október 12., 12:30-kori változata

(Preserving and Accessing Networked Documentary Resources of Australia)

A National Library of Australia által 1996-ban indított, konzorciális munkamegosztással működő webarchiváló projekt. A saját fejlesztésű PANDAS keretrendszert használják az archívum menedzselésére (Java-programok, Oracle adatkezelő és HTTrack letöltő). Emellett Heritrixet, illetve Webrecorder keretrendszerben PyWb és Warcprox szoftvereket is használnak. A Pandas mellett a Heritrixszel begyűjtött gyűjtemény gondozása a Bamboo keretrendszerben zajlik. Nemcsak komplett webhelyeket, hanem egyedi online dokumentumokat/dokumentumcsoportokat is archiválnak. 2000-re 600, 2008-ra 17,900, 2014-re 37,000, 2016 októberéig pedig 48,233 címet mentettek le legalább egyszer (a tárhelyigény ekkor 25.66 TB volt). Szelektív archiválást folytatnak, elsődlegesen a kormányzati, tudományos és kulturális tartalmat gyűjtik. Az archívum nagy része nyilvános és visszakereshető a könyvtári katalógusokban, sőt a nemzeti bibliográfiába is bekerül. Minden lementett tartalom (egészen fájlszintig lemenően) stabil azonosítót kap.

Az Internet Archive segítségével 2005 óta a teljes .au domain-t is aratják évente, de ezt az anyagot nem szolgáltatják jogi okokból, kutatók kérhetnek csak hozzáférést. Ennek mérete 2008-ban: 3 millió site, 1 milliárd fájl, 34.55 terabájt.

2019-ben a webarchívumot elérhetővé és kereshetővé tették a nemzeti könyvtár digitális dokumentumgyűjteményét kezelő Trove rendszerben is. Az erről szóló márciusi hír szerint ekkor az archívum mérete mintegy 9 milliárd rekord (fájl?) volt, 600 terabájt összméretben.