Elkészültek a nem nyilvános archívumban levő részgyűjtemények címlistáinak kereső és böngésző funkciói. Keresni ezzel az űrlappal kell a webhely neve vagy URL-je alapján. Böngészni pedig a tematikus és az esemény-alapú listákat lehet (utóbbiakat csak táblázatos formában).
Interjú az M1-en
Az M1 tévécsatorna „Ma reggel” című műsorában egy rövid Skype interjú hangzott el Drótos László témafelelőssel az OSZK webarchiválási projektjéről. A felvétel a hirado.hu oldalon nézhető vissza.
Instagram archiválás
Az automatikus módszerekkel, elsősorban a Heritrix robotjával aratható honlapok, blogok és egyéb „hagyományos” weboldalak mellett elkezdtünk kísérletezni a közösségi média megőrzésével is. Első lépésként az Instagramról archiválunk a Webrecorder szoftverrel. Februárban és márciusban 95 gyűjtemény (könyvtár, levéltár, múzeum és galéria), 75 könyvkiadó és 48 könyvesbolt, valamint 138 színház nyilvános Instagram oldalairól töltöttünk le több mint 20 ezer képet és rövid videót. Bár ezeket jogi okokból nem szolgáltathatjuk nyilvánosan, de az eddig lementett és a közeljövőben archiválni tervezett oldalak URL címei itt kilistázhatók.
Együttműködés a KDS-K pályázat nyerteseivel
Februárban, illetve március elején megkerestük a Közgyűjteményi Digitalizálási Stratégia megvalósítása a könyvtárakban keretében tavaly kiírt pályázat nyertes intézményeit azzal kapcsolatban, hogy hogyan tudják támogatni az OSZK webarchiválási tevékenységét. Az első fázisban a városi és megyei könyvtárak munkatársai a régiójukban fontos webhelyek címeit gyűjtik össze, amelyekről azután mentéseket készítünk és egy részüknél megpróbálunk majd a nyilvános szolgáltatáshoz is engedélyt kérni az illetékes tartalomgazdáktól. Reméljük, hogy hosszabb távon is megmarad ez az együttműködés és más közgyűjtemények vagy egyéb intézmények is bekapcsolódnak a közös munkába.
A koronavírus járvánnyal foglalkozó weboldalak archiválása
Február harmadikától elkezdtük heti rendszerességgel menteni a koronavírus járványról szóló magyar nyelvű híreket és információkat a webarchívumba. Jelenleg már közel 90 forrást aratunk, köztük a nagyobb hazai és határon túli híroldalaknak a témával foglalkozó rovatait, illetve ilyen címkével ellátott cikkeit; a kormányzat és más szervezetek, intézmények internetes tájékoztató anyagait; valamint az egészségügyi portálok egyes aloldalait. A lementett tartalom szerzői jogi okokból egyelőre egy zárt archívumba kerül és kutatási célokra lesz majd használható elsősorban. A https://goo.gl/forms/Y1qIIxcM7APPiq443 űrlapon keresztül bárki javasolhat a járvánnyal foglalkozó magyar webhelyet vagy egyéb online információforrást, amit érdemes lenne hosszú távon is megőrizni.
Új honlap
Elkészült a webarchívum új honlapja a webarchivum.oszk.hu címen (alternatív URL: https://webarchive.hu). Ezentúl már csak itt jelennek meg a projekttel kapcsolatos hírek és információk, bár egy ideig még a régi honlap is elérhető marad. Az új felületen lesznek majd kereső és böngésző funkciók is, de ezek fejlesztése még folyamatban van.
Üdvözlő videó a spanyol webarchívum születésnapjára
A spanyol webarchívum fennállásának 10. évfordulóján, február 20-án tartandó rendezvényhez az ottani nemzeti könyvtárban dolgozó kollégák egy-egy rövid videót kértek az IIPC tagoktól. A magyar webarchívumot bemutató és a nemzetközi kapcsolatok fontosságát hangsúlyozó összeállításunk – spanyol felirattal és angol hangalámondással – innen letölthető (a PowerPoint prezentáció pedig innen).
Rákóczi Emlékév Archívum
A II. Rákóczi Ferenc Emlékév alkalmából a Közgyűjteményi Digitalizálási Stratégia pályázat keretében elkészült egy mintaalkalmazás, amely a webarchívum integrálásának lehetőségét mutatja be más könyvtári digitális gyűjteményekkel: https://rakoczi2019.webarchivum.oszk.hu/
A 2. webtér aratás
2019 utolsó hetében lefutott a második olyan aratás, amely a magyar webtér egy jelentősebb részére terjedt ki. A 2018. szeptemberi mentés címlistáját kiegészítettük azokkal a .hu végű domémekkel és aldoménekkel, amelyek az eddig archivált weboldalakban levő linkekben találhatók, valamint a korábbi tematikus aratásokhoz egyenként összegyűjtött mintegy 25 ezer, részben nem magyar szervereken levő URL címmel. A különböző szűrések (pl. duplumok, alias címek, nem működő szerverek, parkoló domének) után végül 246.819 db címen indult el a robot, ami kevesebb mint 8 nap alatt 110 millió URL-t töltött le 6,4 terabájt összméretben.
Karc FM interjú
Moldován István, az OSzK E-könyvtári Szolgáltatások Osztályának vezetője a Karc FM rádió Spájz című műsorában beszélt a webarchiválásról és a digitális megőrzés fontosságáról. Az interjú itt meghallgatható.