Egy újabb tematikus válogatást állítottunk össze, ezúttal a szolgáltatás, a kereskedelem, a szállítás és a közlekedés tematikájába sorolható webhelyekből. A SZOLGKER kódnevet kapott részgyűjtemény első aratására most került sor. A 8766 tételes címlistából kiindulva közel 4,9 millió URL-t töltött le a robot 19 óra alatt, fél terabájt összméretben. A webhelyek listája itt böngészhető, az aratás statisztikája pedig itt nézhető meg.
IIPC GA és WAC 2024
Megkezdődött az internetes tartalmak megőrzésével foglalkozó intézményeket tömörítő nemzetközi konzorcium, az IIPC idei közgyűlése és konferenciája Párizsban. A rendezvénysorozat egyik kapcsolódó eseménye a fiatal kutatók számára megszervezett „Early Scholars Spring School on Web Archives” című workshop, melynek második napján az OSZK webarchiválási csoportjának vezetője, Kalcsó Gyula is részt vesz az egyik kerekasztal beszélgetésen. Az ehhez készült „Web Archiving and its Research Use at the National Széchényi Library (Hungary)” című prezentációja letölthető a honlapunkról.
Kalcsó Gyula Networkshop előadása
Kalcsó Gyula, a webarchiválási csoport vezetője „Képek és metaadataik gyűjteményezése scrapingtechnológiával közösségi képmegosztó oldalról” címmel tartott előadást Egerben az idei Networkshop konferencián. A prezentáció innen tölthető le.
A Balassi Intézet honlapjainak archívuma
Összeállítottunk egy különgyűjteményt a 2016 szeptemberében megszűnt Balassi Intézet és a korábban általa irányított külföldi magyar kulturális intézetek honlapjainak mentéseiből, melyek a Heritrix, illetve a HTTrack programokkal készültek 2020 nyarán, néhány héttel a webszerverek végleges lekapcsolása előtt. A nyilvánosan is megtekinthető oldal itt érhető el.
Beszélgetés Kalcsó Gyulával az OSZK podcast csatornáján
Az Országos Széchényi Könyvtár „csevej” sorozatának 20. adásában Kalcsó Gyulával, a webarchiválási csoport vezetőjével hallható egy félórás beszélgetés, főként a webscraping technológiáról és az archivált tartalmak kutathatóvá tételéről. A műsor a nemzeti könyvtár blogjába beágyazott Youtube lejátszóval hallgatható meg, de elérhető a Spotify-on és a Podcast.hu-n is.
Kérdőíves felmérés a webarchiválási tanfolyam megújításához
Az OSZK Webarchívuma szeretné megújítani a Könyvtári Intézet szervezésében zajló „Az internet archiválása mint közgyűjteményi feladat” című tanfolyamát. Mivel a 2018-as akkreditáció óta már sokan elvégezték az eddigi képzést és azóta sok újdonság is van a webarchiválás területén, aktuálissá vált a tananyag felfrissítése új részek beillesztésével és más hangsúlyok kialakításával. Az új tanfolyamot úgy szeretnénk összeállítani, hogy érdekes legyen a korábbi és az új érdeklődők számára is, ezért a véglegesítés előtt szeretnénk kikérni a potenciális résztvevők véleményét, hogy minél jobban az igényekhez tudjuk igazítani a képzést. Az alábbi, természetesen anonim kérdőív kitöltésével erről kapnánk visszajelzést: https://forms.office.com/e/nXbEB1Lv6p
Új esemény-alapú részgyűjtemény: Önkormányzati és európai parlamenti választások
Elkezdtük a 2024. június 9-re kiírt önkormányzati és EP képviselői választással kapcsolatos hírek és weboldalak gyűjtését. Az aktuális címlista itt nézhető meg. A lista első aratása (a közösségi oldalak nélkül) ma indult és hetente ismételjük majd, várhatóan június végéig.
Új részgyűjtemény: Mezőgazdaság, élelmiszeripar
2024. március 1-én egy újabb tematikus válogatás tömeges aratását indítottuk el. Az elmúlt hetekben több mint 2,5 ezer webcímet gyűjtöttünk össze, melyek általában az agráriummal, illetve azon belül speciálisan az állattenyésztéssel, a növénytermesztéssel, továbbá az élelmiszeriparral és az italgyártással kapcsolatosak. A webehelyek neve és URL címe itt listázható ki, az aratás statisztikai adatai pedig itt nézhetők meg.
Beszélgetés Drótos Lászlóval az OSZK podcast csatornáján
Az OSZK podcast csatornáján megjelent egy 40 perces interjú a webarchívum munkatársával, Drótos Lászlóval „Az internet úttörője” címmel. Az adás meghallgatható a nemzeti könyvtár blogjában, a Spyotify-on vagy a Podcast.hu-n is.
Új részgyűjtemény: Párkapcsolat, család
Egy újabb részgyűjteménnyel bővítettük a webarchívumot. A CSALAD kódnevű címlista most 2 ezer webhelyet tartalmaz és ezekből a főbb témakörökből áll: párkapcsolat, esküvő, házasság, szexualitás, erotika, születés, anyaság, család, gyereknevelés, idősek, halál. A gyűjtemény első aratása pár napja futott le, a statisztika itt nézhető meg.