„Archívumtípusok” változatai közötti eltérés

Innen: MIA
a
a
30. sor: 30. sor:
 
== A mentés módja szerint ==
 
== A mentés módja szerint ==
   
* '''aratással''' (egy [[crawler]] végzi a gyűjtést az eredeti webhelyről, vagy a szolgáltató által "crawler-baráttá" tett felületről, vagy RSS feedről - beállított paraméterek szerint követve a linkeket és archív csomagokat képezve)
+
* '''aratással''' (egy [[crawler]] végzi a gyűjtést az eredeti webhelyről vagy a szolgáltató által "crawler-baráttá" tett felületről vagy RSS-feedről beállított paraméterek szerint követve a linkeket és archív csomagokat képezve)
 
* '''letöltő alkalmazással''' (egy weboldalak lementésére készült szoftverrel vagy böngészőkiegészítővel adott weboldal, vagy adott webhely, vagy adott URL címlista lementése, rendszerint fájlrendszerbe)
 
* '''letöltő alkalmazással''' (egy weboldalak lementésére készült szoftverrel vagy böngészőkiegészítővel adott weboldal, vagy adott webhely, vagy adott URL címlista lementése, rendszerint fájlrendszerbe)
 
* '''push technikával''' (a tartalmat vagy az eredeti szolgáltató szerver küldi be az archívumba, valamilyen szabványos adatcsere protokollon keresztül, pl. rendszeresen tükrözve a teljes site-ot/adatbázist vagy annak XML-be kimentett tartalmát, ill. csak az újdonságokat/változásokat, vagy valamilyen proxy szerver küld be egy másolatot az archívumba minden rajta áthaladó (a felhasználók kliensei által kért) digitális objektumból.
 
* '''push technikával''' (a tartalmat vagy az eredeti szolgáltató szerver küldi be az archívumba, valamilyen szabványos adatcsere protokollon keresztül, pl. rendszeresen tükrözve a teljes site-ot/adatbázist vagy annak XML-be kimentett tartalmát, ill. csak az újdonságokat/változásokat, vagy valamilyen proxy szerver küld be egy másolatot az archívumba minden rajta áthaladó (a felhasználók kliensei által kért) digitális objektumból.

A lap 2023. március 1., 13:33-kori változata

Az interneten található tartalom megőrzésének többféle módszere alakult ki, és előfordul, hogy ezek egy archívumon belül is keverednek, részhalmazokat alkotva a teljes gyűjteményen belül. A típusok csoportosíthatók:

Gyűjtőkör szerint

  • szelektív (valamilyen szempontrendszer szerint válogatott webhelyek, weboldalak, vagy akár egyedi dokumentumok)
    • általános kategóriák (pl. oktatási, tudományos, kormányzati webhelyek)
    • szűkebb témák (pl. adott szakterülethez, földrajzi helyhez, intézményhez, személyhez kötődő tartalmak)
    • események (pl. választások, katasztrófák, háborúk idején minden róluk megjelent tartalom)
    • műfaj (pl. e-folyóiratok, hírportálok, Twitter-üzenetek, Facebook-oldalak, videók)
  • teljes körű (a lehatárolás csak automatikus módszerekkel történik, azon belül teljességre törekedve)
    • világméretű (minden nyilvánosan elérhető online tartalom)
    • világrész méretű (pl. Ausztrália és Óceánia, Skandinávia)
    • nemzeti szintű (pl. a top-level ország-domain alatti, vagy az adott ország állampolgárai/intézményei által bejegyzett domain-ek alatti webhelyek, vagy az adott nemzeti nyelven íródott tartalmak, illetve az adott országgal és nemzettel kapcsolatos tartalmak bármely domain alatt)
    • egyéb domainre vagy subdomainre kiterjedő (pl. minden .gov vagy minden ac.uk alatti webhely)

Az archiváló szerint

  • magán archívum (pl. az illető által létrehozott és/vagy vele kapcsolatos, őt érdeklő online tartalmak lementései)
  • céges archívum (pl. egy adott vállalat által létrehozott és/vagy vele, illetve a versenytársaival/piacával kapcsolatos online tartalmak lementései)
  • intézményi archívum (pl. egy könyvtár gyűjtőkörébe tartozó vagy egy kutatóintézet szakterületéhez kapcsolódó webes tartalmak gyűjteménye)
  • országos archívum (pl. a nemzeti örökség hosszú távú megőrzése céljából a nemzeti könyvtár, vagy levéltár, vagy valamilyen konzorcium által fenntartott archívum)

A tárolási mód szerint

  • fájlrendszerbe mentés (a weboldalt alkotó fájlok egyenkénti tárolása, az eredeti fájlnevek megőrzésével vagy átnevezésével, és a linkek relatívvá tételével, hogy az archív példány is navigálható maradjon)
  • archív állományba mentés (a weboldalakat alkotó objektumoknak és azok technikai metaadatainak nagy fájlokba mentése pl. WARC formátumú csomagokat képezve)
  • egységes formátumba mentés (a weboldalak tartalmának és/vagy kinézetének megőrzése azok eredeti szerkezetének megtartása nélkül, pl. egységesen XML formátumra konvertálva, vagy PDF/A fájlba "nyomtatva" őket, vagy pl. PNG képeket készítve róluk)
  • adatbázisba mentés (elsősorban nem webhelyek, hanem pl. elektronikus levelek, tweetek, blogbejegyzések, Facebook-postok, hírportálokról letöltött cikkek stb. adatbázis-rekordokként való tárolása)

A mentés módja szerint

  • aratással (egy crawler végzi a gyűjtést az eredeti webhelyről vagy a szolgáltató által "crawler-baráttá" tett felületről vagy RSS-feedről – beállított paraméterek szerint követve a linkeket és archív csomagokat képezve)
  • letöltő alkalmazással (egy weboldalak lementésére készült szoftverrel vagy böngészőkiegészítővel adott weboldal, vagy adott webhely, vagy adott URL címlista lementése, rendszerint fájlrendszerbe)
  • push technikával (a tartalmat vagy az eredeti szolgáltató szerver küldi be az archívumba, valamilyen szabványos adatcsere protokollon keresztül, pl. rendszeresen tükrözve a teljes site-ot/adatbázist vagy annak XML-be kimentett tartalmát, ill. csak az újdonságokat/változásokat, vagy valamilyen proxy szerver küld be egy másolatot az archívumba minden rajta áthaladó (a felhasználók kliensei által kért) digitális objektumból.
  • depozitként (az eredeti tartalomgazdák valamilyen offline hordozón adják be alkalmanként a webhelyük tartalmának aktuális másolatát, vagy egy személy/örököse küldi be az online anyagait digitális hagyatékként)

Gyakoriság és idődimenzió szerint

  • ismétlődő mentések hosszú távú megőrzéssel (egy-egy website rendszeres mentése, lehetőleg a webhely változékonyságához optimalizálva, adott időpontbeli állapot visszaállításának lehetőségével, hosszú távra tervezve)
  • ismétlődő mentések az utolsó állapotot megőrizve (egy-egy website rendszeres mentése, de a korábbi változatok megőrzése nélkül, pl. a keresőrendszerek számára szükséges indexeléshez, vagy pl. egy piaci szegmens aktuális állapotát kutató adatbányászathoz)
  • egyedi vagy alkalmi mentések (egy-egy webhely, vagy weblap, vagy webkettes tartalom, vagy dokumentum egyszeri vagy alkalomszerű mentése (pl. hogy egy publikációban stabil URI-val lehessen rá hivatkozni, vagy hogy bizonyítékként felhasználható legyen egy jogi eljárásban)