Alapinformációk és -adatok

A 2023. évi tömeges aratások összesített adatai
    • A webarchiválási projekt 2017 elején indult az Országos Széchényi Könyvtárban.
    • A teszt időszak 2019-ig tartott, 2020-tól már üzemszerűen mennek a tömeges aratások.
    • A cél a digitális formában keletkezett és terjesztett dokumentumok, információforrások megőrzése és kutathatóvá tétele.
    • Az elsődleges gyűjtőkör a tudományos, kulturális, oktatási, illetve közéleti jellegű nyilvános webes tartalmak.
    • Az archiválás formái:
      – ismétlődő mentések válogatott magyar webhelyekről (témák, műfajok, intézmények szerint);
      – eseményekhez kötődő időszakos gyűjtések (hírportálok rovatai, a témában releváns honlapok és blogok);
      – pillanatfelvételek a magyar webtérről (a .hu domén alatti szerverek és egyéb magyar vonatkozású tartalom);
      – egyedi mentések a közösségi médiában nyilvánosan megosztott tartalmakról (elsősorban intézményei oldalak/csatornák, egyelőre kis mennyiségben, tesztelési céllal).
    • A nem nyilvános archívumrész növekedése és összmérete
      (tömörítés utáni adatok)
    • A webarchívum nyílt forráskódú, ingyenes szoftvereket használ.
    • A nemzeti könyvtár a vonatkozó jogszabályok és belső szabályzatok szerint végzi az archiválást és a szolgáltatást.
    • A gyűjteménynek csak egy kis része nyilvános, jogi okok miatt.
    • Statisztikai adatok 2023 végén:

Zárt állomány:
18 db tematikus részgyűjtemény (pl. irodalom, művészet, kultúra, vallás, oktatás, kutatás, önkormányzat, közgyűjtemény)
6 db műfaj szerinti részgyűjtemény (időszaki kiadványok, híroldalak, podkasztok, Facebook, Instagram, Twitter)
19 db esemény- és szeméy-alapú részgyűjtemény (pl. választások, sportesemények, háború, járvány, Karikó Katalin)
1 db földrajzi hely alapú részgyűjtemény (Kárpátalja)
kb. 80 ezer válogatott webhely negyedévenkénti mentései és oldalképei
kb. 1,37 millió részben automatikusan összegyűjtött webhely féléves gyakoriságú mentései és oldalképei
kb. 100 terabájt összméret

Nyilvános állomány:
360 db válogatott és engedélyeztetett vagy nem engedélyköteles webhely negyedéves gyakoriságú mentései
102 db OSZK-s webhely 1-2 alkalommal való mentései
2 db esemény alapú részgyűjtemény (Rákóczi-emlékév, Széchényi Ferenc könyvtáralapítása)
kb. 1,9 terabájt összméret