Hírportálok Instagram oldalai

A webkettes felületek archiválhatóságának tesztelése során az elmúlt héten 20 hazai és határon túli magyar híroldal Instagram posztjait mentettük le. Összesen 11.700 bejegyzést (fotót, képsorozatot és rövid videót) töltöttünk le 15,5 GB méretben, a legrégebbi 2013 júliusi.

Twitter archiválási tapasztalatok

Lezárult a Twitter csatornák archiválhatóságának tesztelése. Az elmúlt hónapban több mint ezer Twitter fiókot mentettünk le, ebből 594 esetben sikerült teljes egészében letölteni a tweet listát és az abba beágyazott videókat és képeket (utóbbiakat csak kis méretben).  A többinél csupán az utolsó kb. 750 tweetet lehetett visszagörgetni a rendszer korlátai miatt. A tapasztalatok szerint sok intézmény és közszereplő csak a Facebook és/vagy Instagram posztjainak linkjeit teszi ki a Twitterre, vagyis érdemi tartalom nincs a csatornájukon. A Twitter amúgy is kevéssé népszerű nálunk, a 2010-es években létrehozott fiókok elég nagy hányada már nem aktív. De azért vannak olyanok is, ahol naponta több, médiatartalommal kiegészített rövid szöveges bejegyzés jelenik meg, vagyis teljes értékű hírforrásként funkcionál a csatorna.

A TORTENELEM részgyűjtemény első aratása

Lefutott a legújabb, „Történelem, hely- és családtörténet” nevű részgyűjteményünk első aratása. A robot 541 kiinduló címről három nap alatt több mint 1 millió, az archívumban eddig még nem szereplő új fájlt töltött le. A részletes statisztika itt nézhető meg. A címlistát a következő hónapokban tovább bővítjük és köszönettel veszünk javaslatokat is az ajánló űrlapunkon keresztül.

Twitter csatornák mentése

Az ArchiveWeb.page Chrome böngészőbe integrálható modulját használva elkezdtünk kísérletezni a Twitter csatornák archiválásával. Első lépésben 89 könyvtár, múzeum és galéria oldalát töltöttük le 600 MB összméretben. 75 esetben sikerült egészen az első bejegyzésig visszagörgetni, a legrégebbi elmentett tweet 2007 decemberi volt.

A „404-es workshop” három előadása a Könyvtári Figyelőben

A Könyvtári Figyelő idei első számában megjelent a 2020 decemberében megrendezett „404 Not Found – Ki őrzi meg az internetet?” online workshop megnyitó beszéde, melyet Latorcai Csaba államtitkár tartott, valamint a Webarchiválási Osztály munkatársainak két előadása „Az OSZK webarchívumának 2020-as újdonságai” és „Együttműködési lehetőségek a webarchiválás területén” címmel.

Sportesemények híreinek aratása

Egy újabb esemény-alapú aratást indítottunk heti rendszerességgel: a járvány miatt 2020-ról 2021-re halasztott Foci EB-vel kapcsolatos híreket gyűjtjük a főbb magyar nyelvű online forrásokból. Továbbá újraindítottuk a tokiói Nyári Olimpiáról szóló cikkek archiválását, amelyet tavaly májusban leállítottunk, miután kiderült, hogy ez az esemény is halasztásra került.