Twitter archiválási tapasztalatok

Lezárult a Twitter csatornák archiválhatóságának tesztelése. Az elmúlt hónapban több mint ezer Twitter fiókot mentettünk le, ebből 594 esetben sikerült teljes egészében letölteni a tweet listát és az abba beágyazott videókat és képeket (utóbbiakat csak kis méretben).  A többinél csupán az utolsó kb. 750 tweetet lehetett visszagörgetni a rendszer korlátai miatt. A tapasztalatok szerint sok intézmény és közszereplő csak a Facebook és/vagy Instagram posztjainak linkjeit teszi ki a Twitterre, vagyis érdemi tartalom nincs a csatornájukon. A Twitter amúgy is kevéssé népszerű nálunk, a 2010-es években létrehozott fiókok elég nagy hányada már nem aktív. De azért vannak olyanok is, ahol naponta több, médiatartalommal kiegészített rövid szöveges bejegyzés jelenik meg, vagyis teljes értékű hírforrásként funkcionál a csatorna.

A TORTENELEM részgyűjtemény első aratása

Lefutott a legújabb, „Történelem, hely- és családtörténet” nevű részgyűjteményünk első aratása. A robot 541 kiinduló címről három nap alatt több mint 1 millió, az archívumban eddig még nem szereplő új fájlt töltött le. A részletes statisztika itt nézhető meg. A címlistát a következő hónapokban tovább bővítjük és köszönettel veszünk javaslatokat is az ajánló űrlapunkon keresztül.

Twitter csatornák mentése

Az ArchiveWeb.page Chrome böngészőbe integrálható modulját használva elkezdtünk kísérletezni a Twitter csatornák archiválásával. Első lépésben 89 könyvtár, múzeum és galéria oldalát töltöttük le 600 MB összméretben. 75 esetben sikerült egészen az első bejegyzésig visszagörgetni, a legrégebbi elmentett tweet 2007 decemberi volt.

A „404-es workshop” három előadása a Könyvtári Figyelőben

A Könyvtári Figyelő idei első számában megjelent a 2020 decemberében megrendezett „404 Not Found – Ki őrzi meg az internetet?” online workshop megnyitó beszéde, melyet Latorcai Csaba államtitkár tartott, valamint a Webarchiválási Osztály munkatársainak két előadása „Az OSZK webarchívumának 2020-as újdonságai” és „Együttműködési lehetőségek a webarchiválás területén” címmel.

Sportesemények híreinek aratása

Egy újabb esemény-alapú aratást indítottunk heti rendszerességgel: a járvány miatt 2020-ról 2021-re halasztott Foci EB-vel kapcsolatos híreket gyűjtjük a főbb magyar nyelvű online forrásokból. Továbbá újraindítottuk a tokiói Nyári Olimpiáról szóló cikkek archiválását, amelyet tavaly májusban leállítottunk, miután kiderült, hogy ez az esemény is halasztásra került.

Networkshop 2021 előadások

Felkerültek a honlapra az idén 30 éves Networkshop konferencián megtartott webarchiválás témájú előadásaink prezentációi:

Drótos László – Ipacs Eszter – Németh Márton: Online időszaki kiadványok megőrzése az OSZK Webarchívumában és az EPA-ban (tutoriál)
https://webarchivum.oszk.hu/wp-content/uploads/2021/04/MIA_EPA_tutorial_NWS2021.pptx
https://webarchivum.oszk.hu/wp-content/uploads/2021/04/Networkshop_tutorial_Ipacs_Eszter_EPA.pptx

Drótos László: A közösségi média archiválásának nehézségei
https://webarchivum.oszk.hu/wp-content/uploads/2021/03/Drotos_Laszlo_A_kozossegi_media_archivalasanak_nehezsegei.pptx

Németh Márton: A COVID járvánnyal kapcsolatos webarchiválási tevékenységek – nemzetközi és hazai körkép
https://webarchivum.oszk.hu/wp-content/uploads/2021/04/Nemeth_Marton_NWS-2021.pptx