BnF - Archives de l'internet (francia)

Innen: MIA
A lap korábbi változatát látod, amilyen Admin (vitalap | szerkesztései) 2020. február 7., 23:30-kor történt szerkesztése után volt.
(eltér) ← Régebbi változat | Aktuális változat (eltér) | Újabb változat→ (eltér)

A Bibliothèque nationale de France 2002-ben, a választásokkal kapcsolatos webhelyekkel kezdte el a webarchiválást. 2004-től 5 évig az Internet Archive végezte számukra az éves aratásokat és megvették tőle a korábban lementett francia anyagot is. Közben saját rendszert építettek ki (a Heritrix-re, illetve a NAS-ra alapozva) és most már önállóan végzik ezt a tevékenységet. A jogi hátteret 2006-ra sikerült megteremteni, ami feljogosítja a francia nemzeti könyvtárat az .fr domain ill. a francia fennhatóság alá tartozó területek top level domain-jai (pl. a .re, .gf) és a regionális domain-ek (pl. .bzh, .paris), valamint a más domain-ek alatti francia vonatkozású webes tartalom gyűjtésére, megőrzésére és szolgáltatására.

Teljes körű és szelektív archiválást egyaránt végeznek, és mindenféle fájltípust megőriznek. A francia webteret évente egyszer aratják a DNS szolgáltatók és más internetes cégek segítségével (2016-ban 4,5 millió webhelyet mentettek így le). Szelektíven pedig kb. 20 ezer site-ot mentenek változó gyakorisággal (ebből kb. száz újságot naponta), melyeket könyvtárosok (85-en) és külső partnerek (több mint 20 regionális könyvtárból, tudományos intézetekből és egyéb szervezetekből) válogatnak téma vagy esemény alapon. A teljes archívum 2016 végén 29 milliárd fájlt tartalmazott 1996-ig visszamenőleg. (2015-ben ez a szám 26 milliárd volt és akkor 668 terabájtot foglalt el az anyag). 2014-ig ARC fájlokba mentettek, utána tértek át a WARC-ra. Két szalagos mentést őriznek földrajzilag távol és egy másolat van diszken a könyvtár SPAR nevű, digitális megőrzésre szolgáló rendszerében. Keresni URL cím, a webhely neve és egyéb metaadatok alapján lehet, de vannak böngészhető részgyűjtemények, virtuális kiállítások is. Az archívumhoz csak helyben lehet hozzáférni.

A WAC_2019 konferencián bejelentették, hogy a 2011 óta nem frissített, saját keretrendszerüket, mely egyebek mellett minőségellenőrzési és metaadatkezelési funkciókkal egészíti ki a NAS-t, elkezdték továbbfejleszteni és megújítani a felhasználói felületét. A rendszert várhatóan 2019 végén open source szoftverként nyilvánosan is közzéteszik majd.