Keresés az Atlétikai VB 2023 részgyűjteményben

Az Országos Széchényi Könyvtár Digitális Bölcsészeti Központjának Digitális Filológiai és Webarchiválási Osztálya webarchiválási tevékenységének részeként jelentősebb eseményekről különgyűjteményeket készít, amelyekbe hírportálok anyaga, az eseményhez kapcsolódó webhelyek és közösségimédia-oldalak kerülnek bele. Az eddigi gyűjtések közül az orosz–ukrán konfliktushoz kapcsolódó részgyűjteményhez készült publikus keresőfelület.

A 2023-as budapesti atlétikai világbajnokság esetében is elvégeztük az ún. eseményalapú gyűjtést, amelynek keretében több mint 100 forrásból mentettünk tartalmakat. Ezek többsége hírportál, de tartalmazza a rendezvényhez szorosan kapcsolódó webhelyeket, valamint közösségimédia-oldalakat is. Mivel az automatikus mentés ún. kiinduló URL-ek (seed URL-ek) alapján történik, amelyek sokszor vegyes tartalmúak, ezért nem küszöbölhető ki, hogy a hírportálokról mentett anyag esetében bizonyos, az eseményhez szorosan nem kapcsolódó tartalmak is mentésre kerüljenek. Az archiválás 2023. augusztus 18-tól 31-ig napi rendszerességgel történik, 2023. szeptember 8-én egy kiegészítő mentéssel zárul.

A dán nemzeti könyvtár munkatársai évek óta fejlesztik a SolrWayback nevű keresőmotort és megjelenítőt, amely az Apache Solr-on alapul, és lehetővé teszi az archivált webes tartalomban (a webhelyek szövegében és más elemeiben, pl. képekben) való részletes keresést, és a találatok megjelenítését. (A nyilvános archívumunk esetében kipróbálható teljes funkcionalitásában.) Az atlétikai VB-hez készült kereső elérhető a https://atletikavb2023.webharvest.oszk.hu/solrwayback/ címen. A keresőmező melletti kérdőjelre kattintva részletes, magyar nyelvű leírás olvasható. A mentések jogi akadályok miatt csak az Országos Széchényi Könyvtár olvasótermében tekinthetők meg, viszont a találati listák a nyilvános keresőben tovább szűrhetők, számos metaadatot tartalmaznak, valamint adatvizualizációk és adatkészletek is előállíthatóak belőlük.