Keresés a Nyári Olimpia 2024 részgyűjteményben

Az Országos Széchényi Könyvtár Digitális Bölcsészeti Központjának Digitális Filológiai és Webarchiválási Osztálya webarchiválási tevékenységének részeként jelentősebb eseményekről különgyűjteményeket készít, amelyekbe hírportálok anyagai, az eseményhez kapcsolódó webhelyek és közösségimédia-oldalak kerülnek bele. Az eddigi válogatások közül az orosz–ukrán konfliktus és az atlétikai világbajnokság gyűjteményeihez készült publikus keresőfelület.

A 2024-es párizsi  olimpia és paralimpia esetében is elvégeztük az ún. eseményalapú gyűjtést, amelynek keretében több mint 160 forrásból mentünk tartalmakat. Ezek többsége hírportál, de a címlista tartalmazza a rendezvényhez szorosan kapcsolódó webhelyeket vagy azok releváns részeit, valamint a közösségimédia-oldalakat is. Az automatikus aratás ún. seed URL-ekről elindulva történik és mivel egész weboldalakat archiválunk, nem küszöbölhető ki, hogy a hírportálokról mentett anyag esetében bizonyos, az eseményhez nem kapcsolódó tartalmak is letöltésre kerüljenek, például további ajánlott cikkek. Az archiválás 2024. július 16-án indult és az olimpia ideje alatt napi rendszerességgel történik, azt követően pedig még egy ideig hetente egyszer lementjük az új híreket. (Ezen a videón az eseményalapú különgyűjtemények weboldala és a NYAROL2024 kódjelet kapott olimpiai különgyűjtemény seed-listája látható.)

A dán nemzeti könyvtár munkatársai évek óta fejlesztik a SolrWayback nevű keresőmotort és megjelenítőt, amely az Apache Solr-on alapul, és lehetővé teszi az archivált webes tartalomban (a webhelyek szövegében és más elemeiben, pl. képekben) való részletes keresést, és a találatok megjelenítését. (A nyilvános archívumunk esetében kipróbálható teljes funkcionalitásában.) A nyári olimpiáról szóló hírekhez készült kereső az http://olimpia2024public.webharvest.oszk.hu/solrwayback címen érhető el. A keresőmező melletti kérdőjelre kattintva részletes, magyar nyelvű leírás olvasható.  A mentések jogi akadályok miatt csak az Országos Széchényi Könyvtár olvasótermében tekinthetők meg, viszont a találati listák a nyilvános keresőben tovább szűrhetők, számos metaadatot tartalmaznak, valamint adatvizualizációk és adatkészletek is előállíthatóak belőlük. (Egy keresési példa itt nézhető meg, ezen a harmadik videón pedig a magyar olimpiai részvételről szóló Wikipédia szócikk eredeti és archivált verziója látható.)