„GC WA (kanadai)” változatai közötti eltérés
(Új oldal, tartalma: „= (Government of Canada Web Archive) = A Library and Archives Canada 2005 végén indult webarchívuma, mely egy 2004-es törvénymódosítás alapján aratja (ma már…”) |
(Nincs különbség)
|
A lap jelenlegi, 2017. július 23., 19:17-kori változata
(Government of Canada Web Archive)
A Library and Archives Canada 2005 végén indult webarchívuma, mely egy 2004-es törvénymódosítás alapján aratja (ma már általában félévenként) a kanadai kormányzati domain alatti webhelyeket (beleértve egyes intranetek anyagát is, ha erre engedélyt kapnak és ha technikailag megoldható). A Heritrix, Wayback, NutchWAX hármast használják a begyűjtéshez, a megjelenítéshez és a kereséshez. Amíg nem volt saját infrastruktúrájuk, addig az Archive-It szolgáltatást vették igénybe és 2008-ban le is álltak egy időre, mert újragondolták a gyarapítási politikájukat. A nyilvános keresőfelület 2007 őszén készült el, ekkor kb. 100 millió objektum (több mint 4 terabájt) volt elérhető. 2013 végén ez a szám 183 millió (7.5 terabájt), de volt még további 8 terabájtnyi nem szolgáltatott mentésük is. Keresni teljes szöveg, intézménynév, fájlformátum és URL cím alapján lehet. (A Google és egyéb keresőgépek robotjai ki vannak zárva, így azokkal nem található meg az archívumban levő tartalom.)
A kormányzati domain teljes aratása mellett a kanadai nemzeti könyvtár és levéltár szelektíven is archivál más webhelyeket vagy azokon belül egyes dokumentumokat. Ezek a digitális állományba kerülnek és a központi AMICUS katalógusban is visszakereshetők. Néhány részhalmaz: a 2006-os választások, az olimpiák, a kanadai Sulinet site-ok, a Calgary Rodeó 100. évfordulója, a 2013-as Lac-Mégantic-i vasúti szerencsétlenség. A .ca domain teljes körű aratását eddig nem merték bevállalni a jogi és technikai nehézségek miatt.