Archívumtípusok

Innen: MIA
A lap korábbi változatát látod, amilyen Admin (vitalap | szerkesztései) 2021. szeptember 4., 13:58-kor történt szerkesztése után volt.

Az interneten található tartalom megőrzésének többféle módszere alakult ki, és előfordul, hogy ezek egy archívumon belül is keverednek, részhalmazokat alkotva a teljes gyűjteményen belül. A típusok csoportosíthatók:

Gyűjtőkör szerint

  • szelektív (valamilyen szempontrendszer szerint válogatott webhelyek, weboldalak, vagy akár egyedi dokumentumok)
    • általános kategóriák (pl. oktatási, tudományos, kormányzati webhelyek)
    • szűkebb témák (pl. adott szakterülethez, földrajzi helyhez, intézményhez, személyhez kötődő tartalmak)
    • események (pl. választások, katasztrófák, háborúk idején minden róluk megjelent tartalom)
    • műfaj (pl. e-folyóiratok, hírportálok, Twitter üzenetek, Facebook oldalak, videók)
  • teljes körű (a lehatárolás csak automatikus módszerekkel történik, azon belül teljességre törekedve)
    • világméretű (minden nyilvánosan elérhető online tartalom)
    • világrész méretű (pl. Ausztrália és Óceánia, Skandinávia)
    • nemzeti szintű (pl. a top-level ország-domain alatti, vagy az adott ország állampolgárai/intézményei által bejegyzett domain-ek alatti webhelyek, vagy az adott nemzeti nyelven íródott tartalmak, illetve az adott országgal és nemzettel kapcsolatos tartalmak bármely domain alatt)
    • egyéb domainre vagy sub-domainre kiterjedő (pl. minden .gov vagy minden ac.uk alatti webhely)

Az archiváló szerint

  • magán archívum (pl. az illető által létrehozott és/vagy vele kapcsolatos, őt érdeklő online tartalmak lementései)
  • céges archívum (pl. egy adott vállalat által létrehozott és/vagy vele, illetve a versenytársaival/piacával kapcsolatos online tartalmak lementései)
  • intézményi archívum (pl. egy könyvtár gyűjtőkörébe tartozó vagy egy kutatóintézet szakterületéhez kapcsolódó webes tartalmak gyűjteménye)
  • országos archívum (pl. a nemzeti örökség hosszú távú megőrzése céljából a nemzeti könyvtár, vagy levéltár, vagy valamilyen konzorcium által fenntartott archívum)

A tárolási mód szerint

  • fájlrendszerbe mentés (a weboldalt alkotó fájlok egyenkénti tárolása, az eredeti fájlnevek megőrzésével vagy átnevezésével, és a linkek relatívvá tételével, hogy az archív példány is navigálható maradjon)
  • archív állományba mentés (a weboldalakat alkotó objektumoknak és azok technikai metaadatainak nagy fájlokba mentése pl. WARC formátumú csomagokat képezve)
  • egységes formátumba mentés (a weboldalak tartalmának és/vagy kinézetének megőrzése azok eredeti szerkezetének megtartása nélkül, pl. egységesen XML formátumra konvertálva, vagy PDF/A fájlba "nyomtatva" őket, vagy pl. PNG képeket készítve róluk)
  • adatbázisba mentés (elsősorban nem webhelyek, hanem pl. elektronikus levelek, tweetek, blogbejegyzések, Facebook post-ok, hírportálokról letöltött cikkek stb. adatbázis-rekordokként való tárolása)

A mentés módja szerint

  • aratással (egy crawler végzi a gyűjtést az eredeti webhelyről, vagy a szolgáltató által "crawler-baráttá" tett felületről, vagy RSS feedről - beállított paraméterek szerint követve a linkeket és archív csomagokat képezve)
  • letöltő alkalmazással (egy weboldalak lementésére készült szoftverrel vagy böngészőkiegészítővel adott weboldal, vagy adott webhely, vagy adott URL címlista lementése, rendszerint fájlrendszerbe)
  • push technikával (a tartalmat vagy az eredeti szolgáltató szerver küldi be az archívumba, valamilyen szabványos adatcsere protokollon keresztül, pl. rendszeresen tükrözve a teljes site-ot/adatbázist vagy annak XML-be kimentett tartalmát, ill. csak az újdonságokat/változásokat, vagy valamilyen proxy szerver küld be egy másolatot az archívumba minden rajta áthaladó (a felhasználók kliensei által kért) digitális objektumból.
  • depozitként (az eredeti tartalomgazdák valamilyen offline hordozón adják be alkalmanként a webhelyük tartalmának aktuális másolatát, vagy egy személy/örököse küldi be az online anyagait digitális hagyatékként)

Gyakoriság és idődimenzió szerint

  • ismétlődő mentések hosszú távú megőrzéssel (egy-egy website rendszeres mentése, lehetőleg a webhely változékonyságához optimalizálva, adott időpontbeli állapot visszaállításának lehetőségével, hosszú távra tervezve)
  • ismétlődő mentések az utolsó állapotot megőrizve (egy-egy website rendszeres mentése, de a korábbi változatok megőrzése nélkül, pl. a keresőrendszerek számára szükséges indexeléshez, vagy pl. egy piaci szegmens aktuális állapotát kutató adatbányászathoz)
  • egyedi vagy alkalmi mentések (egy-egy webhely, vagy weblap, vagy webkettes tartalom, vagy dokumentum egyszeri vagy alkalomszerű mentése (pl. hogy egy publikációban stabil URI-val lehessen rá hivatkozni, vagy hogy bizonyítékként felhasználható legyen egy jogi eljárásban)