A koronavírus járvánnyal foglalkozó weboldalak archiválása

Február harmadikától elkezdtük heti rendszerességgel menteni a koronavírus járványról szóló magyar nyelvű híreket és információkat a webarchívumba. Jelenleg már közel 90 forrást aratunk, köztük a nagyobb hazai és határon túli híroldalaknak a témával foglalkozó rovatait, illetve ilyen címkével ellátott cikkeit; a kormányzat és más szervezetek, intézmények internetes tájékoztató anyagait; valamint az egészségügyi portálok egyes aloldalait. A lementett tartalom szerzői jogi okokból egyelőre egy zárt archívumba kerül és kutatási célokra lesz majd használható elsősorban. A https://goo.gl/forms/Y1qIIxcM7APPiq443 űrlapon keresztül bárki javasolhat a járvánnyal foglalkozó magyar webhelyet vagy egyéb online információforrást, amit érdemes lenne hosszú távon is megőrizni.

Üdvözlő videó a spanyol webarchívum születésnapjára

A spanyol webarchívum fennállásának 10. évfordulóján, február 20-án tartandó rendezvényhez az ottani nemzeti könyvtárban dolgozó kollégák egy-egy rövid videót kértek az IIPC tagoktól. A magyar webarchívumot bemutató és a nemzetközi kapcsolatok fontosságát hangsúlyozó összeállításunk – spanyol felirattal és angol hangalámondással – innen letölthető (a PowerPoint prezentáció pedig innen).

A 2. webtér aratás

2019 utolsó hetében lefutott a második olyan aratás, amely a magyar webtér egy jelentősebb részére terjedt ki. A 2018. szeptemberi mentés címlistáját kiegészítettük azokkal a .hu végű domémekkel és aldoménekkel, amelyek az eddig archivált weboldalakban levő linkekben találhatók, valamint a korábbi tematikus aratásokhoz egyenként összegyűjtött mintegy 25 ezer, részben nem magyar szervereken levő URL címmel. A különböző szűrések (pl. duplumok, alias címek, nem működő szerverek, parkoló domének) után végül 246.819 db címen indult el a robot, ami kevesebb mint 8 nap alatt 110 millió URL-t töltött le 6,4 terabájt összméretben.

CDA 2019 konferenciaelőadás Pozsonyban

Németh Mártonnak a pozsonyi egyetemi könyvtárban rendezett CDA 2019 konferencián november 5-én bemutatott „Potential use of microdata in web-archiving context” című prezentációja innen tölthető le. Az előadás a beágyazott mikroadatok lehetséges előnyeit ismerteti a webes tartalmak archiválása, kutatása és hosszú távú megőrzése szempontjából.

Webarchiválás panel a DH 2019 konferencián

Németh Márton „Introduction to web archiving in Digital Humanities context” címmel tartott előadást 2019. szept. 25-én a DH_Budapest_2019 konferencia webarchiválási szekciójában az ELTE-n. A prezentáció innen tölthető le. Szintén ezen a rendezvényen mutatta be Marie Haškovcová a cseh webarchívumot, ez az előadás is elérhető a honlapról, akárcsak Indig Balázs, Kákonyi Tibor és Novák Attila „Crawling in Reverse – Lightweight Targeted Crawling of News Portals” című előadása, mely a nyelvészeti célú kutatások céljából végzett webaratásról szól. A magyar származású Kees Teszelszky pedig a holland webarchívumban megőrzött fríz web doménről beszélt, az ő prezentációja itt tölthető le.