HAW (horvát)

Innen: MIA
A lap korábbi változatát látod, amilyen Admin (vitalap | szerkesztései) 2017. július 23., 19:23-kor történt szerkesztése után volt. (Új oldal, tartalma: „= (Hrvatski Arhiv Weba) = A horvát nemzeti és egyetemi könyvtár 1998-ban kezdett el katalogizálni webhelyeket távoli forrásként. 2003-ban a zágrábi egyetem s…”)
(eltér) ← Régebbi változat | Aktuális változat (eltér) | Újabb változat→ (eltér)

(Hrvatski Arhiv Weba)

A horvát nemzeti és egyetemi könyvtár 1998-ban kezdett el katalogizálni webhelyeket távoli forrásként. 2003-ban a zágrábi egyetem számítóközpontjával együtt kidolgoztak egy DAMP (Digital Archive of Croatian Web Publications) nevű, webes tartalmakat archiváló rendszert, amely 2004 januárjától működik. 2010-ben egyértelműbb nevet ("horvát webarchívum") kapott a szolgáltatás és már üzemszerűen működik 2011 óta. A tematikus gyűjtés mellett azóta a .hr domaint is aratják nagyjából évente a Heritrix-szel. Az elsőt 2011 nyarán futtatták egy hónapig és 56 millió fájlt, 3,1 terabájtot gyűjtött össze, 2015 elején pedig már 74 millió fájlt, 6.1 terabájtot mentettek le. A teljes archívum 2015 novemberében 206 millió fájl, 7.4 terabájt volt (5.840 webhely 40.883 alkalommal való mentése). A minőségellenőrzéshez és a seed URL-ek adatbázisának karbantartásához saját szoftvereket is fejlesztettek az évek során (pl. 500 megabájtnál nagyobb fájlok kiszűrése, 80%-nál nagyobb arányban egyező mentések jelzése, az élő webről az elmúlt hónapban eltűnt site-ok listája). Az archívum nagy része nyilvános, ha pedig egy tartalomszolgáltató ezt nem engedélyezi, annak az archivált anyaga a könyvtárban helyben érhető el. A metaadatok a könyvtár katalógusába is bekerülnek.