A Könyvtári Intézet beszerzett egy ISO szabványt és egy ISO Technical Report-ot a webarchiválás területéről. Az ISO 28500:2009 a lementett webhelyek tárolására használt WARC fájlformátumot definiálja (a szövegtervezet itt olvasható). Az ISO/TR 14873:2013 pedig a webarchívumok statisztikai, fogalmi és minőségi jellemzőit határozza meg (a draft változat innen tölthető le).
Válogatott bibliográfia a webarchiválásról
Elkezdtünk egy válogatott bibliográfiát építeni a téma idegen nyelvű szakirodalmából. Az első változat már itt megnézhető.
Webarchiválás külföldön – összefoglaló anyagok
Németh Márton – új munkatársunk
A OSZK E-könyvtári Szolgáltatások Osztálya új munkatárssal bővült: Németh Márton kifejezetten az internet archiválással kapcsolatos könyvtárosi feladatokkal, a nemzetközi tapasztalatok hazai adaptálásával, a webaratási pilot projekt menedzselésével fog foglalkozni.
MIA Wiki frissítés
Frissült a kiexportált MIA Wiki. Jelenleg 423 szócikk és 863 külső link van benne. Főleg a SZOFTVEREK fejezet bővült az elmúlt napokban.
Levelezőlista a webarchiválásról
A web és más internetes források archiválása, egy leendő Magyar Internet Archívum létrehozása iránt érdeklődők számára elindult a MIA-l nevű levelezőlista, melyre a http://mekosztaly.oszk.hu/cgi-bin/mailman/listinfo/mia-loldalon lehet feliratkozni és a mia-l@mek.oszk.hu címen lehet levelet küldeni. (A feliratkozási kérelem adminisztrátori jóváhagyás után lép életbe.) A listán az OSZK-s webaratási projekttel kapcsolatos fejlemények mellett egyéb információkat is meg lehet osztani a webhelyek és egyéb online tartalmak hosszú távú megőrzésével kapcsolatban.
Az első tesztaratás eredményei
Április 26. és május 3. között lefutott az első komolyabb tesztaratás, amely az EPA-ban „távoli”-ként katalogizált magyar időszaki kiadványokra terjedt ki és 4 terabájt összméret elérése után le lett állítva. A futási idő 7 nap és 5 óra 47 perc volt. Ez alatt a Heritrix crawler 2.068 URL seed címet nézett végig, 219-nél nem tudott elindulni (vagy azért, mert már megszűnt az oldal, vagy mert ki vannak róla tiltva a robotok), 69.117 hostról mintegy 40 millió linket követett sikeresen (másodpercenként átlagosan 64-et, 6.7 megabájtos letöltési sebességgel), a sikertelenül lekért URI-k száma 1,74 millió volt, a figyelmen kívül hagyottaké pedig 1.85 millió. A webszerverek által visszaküldött fájlok MIME típusainak összesítése itt megnézhető (ugyanaz a típus többféle névvel vagy írásmóddal is előfordul benne!).
Kokas Károly a Szeged TV-ben a webarchiválásról
Kokas Károly, a SZTE Klebelsberg Könyvtár főigazgató-helyettese a SZEGED TV Körút című műsorában beszélt a webarchiválás fontosságáról. (26:14-ig kell előretekerni a felvételben.)
E-periodika honlapgyűjtés indul
Megkezdődött az EPA-ban távoli tételként leírt elektronikus periodikák átnézése és a kapcsolati e-mail címek összegyűjtése.
MIA Wiki frissítés
Új verzió került ki a MIA Wikiből a nyilvános felületre, ami már 373 szócikket és 784 külső linket tartalmaz. Keresni a Ctrl/F megnyomásával lehet benne.