„A jövő könyvtára felé…” webinárium-sorozat keretében 2017. június 1-én 13 órai kezdettel Drótos László tart előadást „Az internet archiválása, mint könyvtári feladat” címmel a II. Rákóczi Ferenc Megyei és Városi Könyvtár előadótermében (Miskolc, Görgey Artúr u. 11.). Az élő videóközvetítés a http://www.ustream.tv/channel/hjrRWJU4xGH oldalon lesz. (A KIT Hírlevélben megjelent ajánló.)
ISO anyagok a webarchiválásról az OSZK KSZK-ban
A Könyvtári Intézet beszerzett egy ISO szabványt és egy ISO Technical Report-ot a webarchiválás területéről. Az ISO 28500:2009 a lementett webhelyek tárolására használt WARC fájlformátumot definiálja (a szövegtervezet itt olvasható). Az ISO/TR 14873:2013 pedig a webarchívumok statisztikai, fogalmi és minőségi jellemzőit határozza meg (a draft változat innen tölthető le).
Válogatott bibliográfia a webarchiválásról
Elkezdtünk egy válogatott bibliográfiát építeni a téma idegen nyelvű szakirodalmából. Az első változat már itt megnézhető.
Webarchiválás külföldön – összefoglaló anyagok
Németh Márton – új munkatársunk
A OSZK E-könyvtári Szolgáltatások Osztálya új munkatárssal bővült: Németh Márton kifejezetten az internet archiválással kapcsolatos könyvtárosi feladatokkal, a nemzetközi tapasztalatok hazai adaptálásával, a webaratási pilot projekt menedzselésével fog foglalkozni.
MIA Wiki frissítés
Frissült a kiexportált MIA Wiki. Jelenleg 423 szócikk és 863 külső link van benne. Főleg a SZOFTVEREK fejezet bővült az elmúlt napokban.
Levelezőlista a webarchiválásról
A web és más internetes források archiválása, egy leendő Magyar Internet Archívum létrehozása iránt érdeklődők számára elindult a MIA-l nevű levelezőlista, melyre a http://mekosztaly.oszk.hu/cgi-bin/mailman/listinfo/mia-loldalon lehet feliratkozni és a mia-l@mek.oszk.hu címen lehet levelet küldeni. (A feliratkozási kérelem adminisztrátori jóváhagyás után lép életbe.) A listán az OSZK-s webaratási projekttel kapcsolatos fejlemények mellett egyéb információkat is meg lehet osztani a webhelyek és egyéb online tartalmak hosszú távú megőrzésével kapcsolatban.
Az első tesztaratás eredményei
Április 26. és május 3. között lefutott az első komolyabb tesztaratás, amely az EPA-ban „távoli”-ként katalogizált magyar időszaki kiadványokra terjedt ki és 4 terabájt összméret elérése után le lett állítva. A futási idő 7 nap és 5 óra 47 perc volt. Ez alatt a Heritrix crawler 2.068 URL seed címet nézett végig, 219-nél nem tudott elindulni (vagy azért, mert már megszűnt az oldal, vagy mert ki vannak róla tiltva a robotok), 69.117 hostról mintegy 40 millió linket követett sikeresen (másodpercenként átlagosan 64-et, 6.7 megabájtos letöltési sebességgel), a sikertelenül lekért URI-k száma 1,74 millió volt, a figyelmen kívül hagyottaké pedig 1.85 millió. A webszerverek által visszaküldött fájlok MIME típusainak összesítése itt megnézhető (ugyanaz a típus többféle névvel vagy írásmóddal is előfordul benne!).
Kokas Károly a Szeged TV-ben a webarchiválásról
Kokas Károly, a SZTE Klebelsberg Könyvtár főigazgató-helyettese a SZEGED TV Körút című műsorában beszélt a webarchiválás fontosságáról. (26:14-ig kell előretekerni a felvételben.)
E-periodika honlapgyűjtés indul
Megkezdődött az EPA-ban távoli tételként leírt elektronikus periodikák átnézése és a kapcsolati e-mail címek összegyűjtése.