Instagram archiválás

Az automatikus módszerekkel, elsősorban a Heritrix robotjával aratható honlapok, blogok és egyéb „hagyományos” weboldalak mellett elkezdtünk kísérletezni a közösségi média megőrzésével is. Első lépésként az Instagramról archiválunk a Webrecorder szoftverrel. Februárban és márciusban 95 gyűjtemény (könyvtár, levéltár, múzeum és galéria), 75 könyvkiadó és 48 könyvesbolt, valamint 138 színház nyilvános Instagram oldalairól töltöttünk le több mint 20 ezer képet és rövid videót. Bár ezeket jogi okokból nem szolgáltathatjuk nyilvánosan, de az eddig lementett és a közeljövőben archiválni tervezett oldalak URL címei itt kilistázhatók.

Együttműködés a KDS-K pályázat nyerteseivel

Februárban, illetve március elején megkerestük a Közgyűjteményi Digitalizálási Stratégia megvalósítása a könyvtárakban keretében tavaly kiírt pályázat nyertes intézményeit azzal kapcsolatban, hogy hogyan tudják támogatni az OSZK webarchiválási tevékenységét. Az első fázisban a városi és megyei könyvtárak munkatársai a régiójukban fontos webhelyek címeit gyűjtik össze, amelyekről azután mentéseket készítünk és egy részüknél megpróbálunk majd a nyilvános szolgáltatáshoz is engedélyt kérni az illetékes tartalomgazdáktól. Reméljük, hogy hosszabb távon is megmarad ez az együttműködés és más közgyűjtemények vagy egyéb intézmények is bekapcsolódnak a közös munkába.

A koronavírus járvánnyal foglalkozó weboldalak archiválása

Február harmadikától elkezdtük heti rendszerességgel menteni a koronavírus járványról szóló magyar nyelvű híreket és információkat a webarchívumba. Jelenleg már közel 90 forrást aratunk, köztük a nagyobb hazai és határon túli híroldalaknak a témával foglalkozó rovatait, illetve ilyen címkével ellátott cikkeit; a kormányzat és más szervezetek, intézmények internetes tájékoztató anyagait; valamint az egészségügyi portálok egyes aloldalait. A lementett tartalom szerzői jogi okokból egyelőre egy zárt archívumba kerül és kutatási célokra lesz majd használható elsősorban. A https://goo.gl/forms/Y1qIIxcM7APPiq443 űrlapon keresztül bárki javasolhat a járvánnyal foglalkozó magyar webhelyet vagy egyéb online információforrást, amit érdemes lenne hosszú távon is megőrizni.

Üdvözlő videó a spanyol webarchívum születésnapjára

A spanyol webarchívum fennállásának 10. évfordulóján, február 20-án tartandó rendezvényhez az ottani nemzeti könyvtárban dolgozó kollégák egy-egy rövid videót kértek az IIPC tagoktól. A magyar webarchívumot bemutató és a nemzetközi kapcsolatok fontosságát hangsúlyozó összeállításunk – spanyol felirattal és angol hangalámondással – innen letölthető (a PowerPoint prezentáció pedig innen).

A 2. webtér aratás

2019 utolsó hetében lefutott a második olyan aratás, amely a magyar webtér egy jelentősebb részére terjedt ki. A 2018. szeptemberi mentés címlistáját kiegészítettük azokkal a .hu végű domémekkel és aldoménekkel, amelyek az eddig archivált weboldalakban levő linkekben találhatók, valamint a korábbi tematikus aratásokhoz egyenként összegyűjtött mintegy 25 ezer, részben nem magyar szervereken levő URL címmel. A különböző szűrések (pl. duplumok, alias címek, nem működő szerverek, parkoló domének) után végül 246.819 db címen indult el a robot, ami kevesebb mint 8 nap alatt 110 millió URL-t töltött le 6,4 terabájt összméretben.