2025. november 12-én kerül megrendezésre az idei „404 Not Found – Ki őrzi meg az internetet?” konferencia és workshop. A részletes program az OSZK honlapján olvasható, regisztrálni pedig itt lehet.
Informatikai infrastruktúra átállás
A webarchívum szervereinek és tárhelyeinek költöztetése miatt a szolgáltatásban fennakadások fordulhatnak elő a következő hetekben és szünetelnek a beütemezett aratások is (néhány nagyobb hírportál napi szintű mentésének kivételével). A honlap és a nyilvános gyűjtemény várhatóan folyamatosan elérhető marad, de utóbbinál a lejárt tanúsítvány miatt már csak úgy nyithatók meg az archivált verziók a Chrome böngészőben, ha az OpenWayback, a PyWb, illetve a SolrWayback megjelenítőket jelképező ikonokra jobb egérgombbal kattintunk rá és a menüből a „Link megnyitása inkognítóablakban” opciót választjuk.
2025 évi első webtér aratás
2025. július 28. és augusztus 21. között elkészült az idei első webtér-szintű aratás. A címlista bővítése érdekében az előző aratásnál használt seed-listához hozzáadtuk az összes korábbi címlistánkat, valamennyi tematikus és két műfaji (periodikák és podkasztok) részgyűjteményt, és kigyűjtöttük a 2018 óta készült WARC fájlokban talált, .hu-t tartalmazó URL-ekben levő domén/aldomén címeket is. A duplumok kiszűrése után lekérdeztük a webszerverek által visszaadott státuszkódot és a működőnek tűnő webhelyek kezdőlapjának title adatát is begyűjtöttük. Utóbbi alapján szétválogattuk a tömegesen generált aldoméneket, valamint az inaktív vagy bejelentkezést igénylő, illetve a gyűjtőkörön kívül eső oldalakat. Az előkészítő munka utolsó fázisaként megvizsgáltuk, hogy van-e robots.txt fájl a szerverek gyökérkönyvtárában, majd eltérő paraméterekkel egynás után elindítottunk három aratási jobot (tomeges, norobots és normal). Az összesített statisztikai adatok itt láthatók, az eddigi webtér aratások főbb adatainak összehasonlítása pedig itt nézhető meg táblázatként és grafikon formájában.
Networkshop előadás a webtér-szintű aratásokról
Május 14-én a győri Networkshop 2025. konferencián Kalcsó Gyula „A magyar webtér aratásával kapcsolatos kurátori feladatok” címmel tartott előadást. A prezentáció innen tölthető le.
Új részgyűjtemény: HUNOR – Magyar Űrhajós Program
Az újabb magyar űrhajós, Kapu Tibor közelgő repülésének alkalmából összeállítottunk egy esemény-alapú részgyűjteményt a HUNOR (Hungarian to Orbit) programról, melynek robottal aratható címeit egyelőre heti rendszerességgel mentjük, az egyedi és a közösségi média oldalakat pedig alkalmanként. A teljes seed-lista itt nézhető meg.
Internetes tartalmak archiválása tanfolyam
A Könyvtári Intézet honlapján megjelent a megújított tematikájú tanfolyamunk ismertetése és a jelentkezéshez használható űrlap. A tájékoztató itt érhető el.
Visszanézhetők a korábbi 404-es konferenciák és workshopok videói
Felkerültek a 2022. december 8-án, a 2023. november 29-én, valamint a 2024. november 27-én megtartott „404 Not Found” konferencia és workshop felvételei a rendezvények weboldalaira. A videók az egyes előadások címe után levő „videó:” feliratú linkre kattintva nézhetők meg.
Előadás a „Mi lesz veled, nyomtatott könyv?” konferencián
2025. január 22-én a Webarchiválási Csoport vezetője, Kalcsó Gyula „Mi a ‘born digital’ gyakorlat, és milyen változást hoz a kulturális intézmények életében?” címmel tart előadást az MMA Művészetelméleti és Módszertani Kutatóintézete által szervezett műhelykonferencián. A rendezvény részletes programja itt található.
2024. évi statisztikák
Január első felére áthúzódva lefutott a 2024 év végi webtér-szintű aratás utolsó job-ja, így már csak az ehhez tartozó oldalképek elkészítése van hátra. A részletes aratási adatok itt megnézhetők. Frissítettük továbbá a webarchívum alapadatainak oldalát és a rajta található két grafikont is.
Cikk a Háromká-ban
A Háromká (Könyv, Könyvtár, Könyvtáros) lap idei utolsó, dupla számában megjelent Kalcsó Gyula írása a helyi vonatkozású webtartalmak archiválásáról és az együttműködés fontosságáról ezen a téren. A teljes cikk itt olvasható.