Miskolci webinárium

„A jövő könyvtára felé…” webinárium-sorozat keretében 2017. június 1-én 13 órai kezdettel Drótos László tart előadást „Az internet archiválása, mint könyvtári feladat” címmel a II. Rákóczi Ferenc Megyei és Városi Könyvtár előadótermében (Miskolc, Görgey Artúr u. 11.). Az élő videóközvetítés a http://www.ustream.tv/channel/hjrRWJU4xGH oldalon lesz. (A KIT Hírlevélben megjelent ajánló.)

Levelezőlista a webarchiválásról

A web és más internetes források archiválása, egy leendő Magyar Internet Archívum létrehozása iránt érdeklődők számára elindult a MIA-l nevű levelezőlista, melyre a http://mekosztaly.oszk.hu/cgi-bin/mailman/listinfo/mia-loldalon lehet feliratkozni és a mia-l@mek.oszk.hu címen lehet levelet küldeni. (A feliratkozási kérelem adminisztrátori jóváhagyás után lép életbe.) A listán az OSZK-s webaratási projekttel kapcsolatos fejlemények mellett egyéb információkat is meg lehet osztani a webhelyek és egyéb online tartalmak hosszú távú megőrzésével kapcsolatban.

Az első tesztaratás eredményei

Április 26. és május 3. között lefutott az első komolyabb tesztaratás, amely az EPA-ban „távoli”-ként katalogizált magyar időszaki kiadványokra terjedt ki és 4 terabájt összméret elérése után le lett állítva. A futási idő 7 nap és 5 óra 47 perc volt. Ez alatt a Heritrix crawler 2.068 URL seed címet nézett végig, 219-nél nem tudott elindulni (vagy azért, mert már megszűnt az oldal, vagy mert ki vannak róla tiltva a robotok), 69.117 hostról mintegy 40 millió linket követett sikeresen (másodpercenként átlagosan 64-et, 6.7 megabájtos letöltési sebességgel), a sikertelenül lekért URI-k száma 1,74 millió volt, a figyelmen kívül hagyottaké pedig 1.85 millió. A webszerverek által visszaküldött fájlok MIME típusainak összesítése itt megnézhető (ugyanaz a típus többféle névvel vagy írásmóddal is előfordul benne!).