„Archívumtípusok” változatai közötti eltérés
(Új oldal, tartalma: „Az interneten található tartalom megőrzésének többféle módszere alakult ki, és előfordul, hogy ezek egy archívumon belül is keverednek, részhalmazokat alko…”) |
a (→Az archiváló szerint) |
||
(9 közbenső módosítás, amit 2 másik szerkesztő végzett, nincs mutatva) | |||
3. sor: | 3. sor: | ||
== Gyűjtőkör szerint == |
== Gyűjtőkör szerint == |
||
− | * '''szelektív''' (valamilyen |
+ | * '''szelektív''' (valamilyen szempontrendszer szerint válogatott webhelyek, weboldalak, vagy akár egyedi dokumentumok) |
** általános kategóriák (pl. oktatási, tudományos, kormányzati webhelyek) |
** általános kategóriák (pl. oktatási, tudományos, kormányzati webhelyek) |
||
** szűkebb témák (pl. adott szakterülethez, földrajzi helyhez, intézményhez, személyhez kötődő tartalmak) |
** szűkebb témák (pl. adott szakterülethez, földrajzi helyhez, intézményhez, személyhez kötődő tartalmak) |
||
** események (pl. választások, katasztrófák, háborúk idején minden róluk megjelent tartalom) |
** események (pl. választások, katasztrófák, háborúk idején minden róluk megjelent tartalom) |
||
− | ** műfaj (pl. e-folyóiratok, hírportálok, Twitter |
+ | ** műfaj (pl. e-folyóiratok, hírportálok, Twitter-üzenetek, Facebook-oldalak, videók) |
* '''teljes körű''' (a lehatárolás csak automatikus módszerekkel történik, azon belül teljességre törekedve) |
* '''teljes körű''' (a lehatárolás csak automatikus módszerekkel történik, azon belül teljességre törekedve) |
||
** világméretű (minden nyilvánosan elérhető online tartalom) |
** világméretű (minden nyilvánosan elérhető online tartalom) |
||
** világrész méretű (pl. Ausztrália és Óceánia, Skandinávia) |
** világrész méretű (pl. Ausztrália és Óceánia, Skandinávia) |
||
− | ** nemzeti szintű (pl. a top-level ország-domain alatti, vagy az adott ország állampolgárai/intézményei által bejegyzett domain-ek alatti webhelyek, vagy az adott nemzeti nyelven íródott tartalmak, illetve az adott országgal és nemzettel kapcsolatos tartalmak bármely domain alatt) |
+ | ** nemzeti szintű (pl. a [[CcTLD|top-level ország-domain]] alatti, vagy az adott ország állampolgárai/intézményei által bejegyzett domain-ek alatti webhelyek, vagy az adott nemzeti nyelven íródott tartalmak, illetve az adott országgal és nemzettel kapcsolatos tartalmak bármely domain alatt) |
− | ** egyéb domainre vagy |
+ | ** egyéb domainre vagy subdomainre kiterjedő (pl. minden .gov vagy minden ac.uk alatti webhely) |
== Az archiváló szerint == |
== Az archiváló szerint == |
||
− | * ''' |
+ | * '''magánarchívum''' (pl. az illető által létrehozott és/vagy vele kapcsolatos, őt érdeklő online tartalmak lementései) |
* '''céges archívum''' (pl. egy adott vállalat által létrehozott és/vagy vele, illetve a versenytársaival/piacával kapcsolatos online tartalmak lementései) |
* '''céges archívum''' (pl. egy adott vállalat által létrehozott és/vagy vele, illetve a versenytársaival/piacával kapcsolatos online tartalmak lementései) |
||
* '''intézményi archívum''' (pl. egy könyvtár gyűjtőkörébe tartozó vagy egy kutatóintézet szakterületéhez kapcsolódó webes tartalmak gyűjteménye) |
* '''intézményi archívum''' (pl. egy könyvtár gyűjtőkörébe tartozó vagy egy kutatóintézet szakterületéhez kapcsolódó webes tartalmak gyűjteménye) |
||
− | * '''országos archívum''' (pl. a nemzeti örökség hosszú távú megőrzése céljából a nemzeti könyvtár |
+ | * '''országos archívum''' (pl. a nemzeti örökség hosszú távú megőrzése céljából a nemzeti könyvtár vagy levéltár vagy valamilyen konzorcium által fenntartott archívum) |
== A tárolási mód szerint == |
== A tárolási mód szerint == |
||
26. sor: | 26. sor: | ||
* '''archív állományba mentés''' (a weboldalakat alkotó objektumoknak és azok technikai metaadatainak nagy fájlokba mentése pl. [[WARC]] formátumú csomagokat képezve) |
* '''archív állományba mentés''' (a weboldalakat alkotó objektumoknak és azok technikai metaadatainak nagy fájlokba mentése pl. [[WARC]] formátumú csomagokat képezve) |
||
* '''egységes formátumba mentés''' (a weboldalak tartalmának és/vagy kinézetének megőrzése azok eredeti szerkezetének megtartása nélkül, pl. egységesen XML formátumra konvertálva, vagy [[PDF A|PDF/A]] fájlba "nyomtatva" őket, vagy pl. PNG képeket készítve róluk) |
* '''egységes formátumba mentés''' (a weboldalak tartalmának és/vagy kinézetének megőrzése azok eredeti szerkezetének megtartása nélkül, pl. egységesen XML formátumra konvertálva, vagy [[PDF A|PDF/A]] fájlba "nyomtatva" őket, vagy pl. PNG képeket készítve róluk) |
||
− | * '''adatbázisba mentés''' (elsősorban nem webhelyek, hanem pl. elektronikus levelek, tweetek, blogbejegyzések, Facebook |
+ | * '''adatbázisba mentés''' (elsősorban nem webhelyek, hanem pl. elektronikus levelek, tweetek, blogbejegyzések, Facebook-postok, hírportálokról letöltött cikkek stb. adatbázis-rekordokként való tárolása) |
== A mentés módja szerint == |
== A mentés módja szerint == |
||
− | * '''aratással''' (egy [[crawler]] végzi a gyűjtést az eredeti webhelyről |
+ | * '''aratással''' (egy [[crawler]] végzi a gyűjtést az eredeti webhelyről vagy a szolgáltató által "crawler-baráttá" tett felületről vagy RSS-feedről – beállított paraméterek szerint követve a linkeket és archív csomagokat képezve) |
− | * ''' |
+ | * '''letöltőalkalmazással''' (egy weboldalak lementésére készült szoftverrel vagy böngészőkiegészítővel adott weboldal, vagy adott webhely, vagy adott URL címlista lementése, rendszerint fájlrendszerbe) |
* '''push technikával''' (a tartalmat vagy az eredeti szolgáltató szerver küldi be az archívumba, valamilyen szabványos adatcsere protokollon keresztül, pl. rendszeresen tükrözve a teljes site-ot/adatbázist vagy annak XML-be kimentett tartalmát, ill. csak az újdonságokat/változásokat, vagy valamilyen proxy szerver küld be egy másolatot az archívumba minden rajta áthaladó (a felhasználók kliensei által kért) digitális objektumból. |
* '''push technikával''' (a tartalmat vagy az eredeti szolgáltató szerver küldi be az archívumba, valamilyen szabványos adatcsere protokollon keresztül, pl. rendszeresen tükrözve a teljes site-ot/adatbázist vagy annak XML-be kimentett tartalmát, ill. csak az újdonságokat/változásokat, vagy valamilyen proxy szerver küld be egy másolatot az archívumba minden rajta áthaladó (a felhasználók kliensei által kért) digitális objektumból. |
||
* '''depozitként''' (az eredeti tartalomgazdák valamilyen offline hordozón adják be alkalmanként a webhelyük tartalmának aktuális másolatát, vagy egy személy/örököse küldi be az online anyagait digitális hagyatékként) |
* '''depozitként''' (az eredeti tartalomgazdák valamilyen offline hordozón adják be alkalmanként a webhelyük tartalmának aktuális másolatát, vagy egy személy/örököse küldi be az online anyagait digitális hagyatékként) |
A lap jelenlegi, 2023. március 1., 13:36-kori változata
Az interneten található tartalom megőrzésének többféle módszere alakult ki, és előfordul, hogy ezek egy archívumon belül is keverednek, részhalmazokat alkotva a teljes gyűjteményen belül. A típusok csoportosíthatók:
Tartalomjegyzék
Gyűjtőkör szerint
- szelektív (valamilyen szempontrendszer szerint válogatott webhelyek, weboldalak, vagy akár egyedi dokumentumok)
- általános kategóriák (pl. oktatási, tudományos, kormányzati webhelyek)
- szűkebb témák (pl. adott szakterülethez, földrajzi helyhez, intézményhez, személyhez kötődő tartalmak)
- események (pl. választások, katasztrófák, háborúk idején minden róluk megjelent tartalom)
- műfaj (pl. e-folyóiratok, hírportálok, Twitter-üzenetek, Facebook-oldalak, videók)
- teljes körű (a lehatárolás csak automatikus módszerekkel történik, azon belül teljességre törekedve)
- világméretű (minden nyilvánosan elérhető online tartalom)
- világrész méretű (pl. Ausztrália és Óceánia, Skandinávia)
- nemzeti szintű (pl. a top-level ország-domain alatti, vagy az adott ország állampolgárai/intézményei által bejegyzett domain-ek alatti webhelyek, vagy az adott nemzeti nyelven íródott tartalmak, illetve az adott országgal és nemzettel kapcsolatos tartalmak bármely domain alatt)
- egyéb domainre vagy subdomainre kiterjedő (pl. minden .gov vagy minden ac.uk alatti webhely)
Az archiváló szerint
- magánarchívum (pl. az illető által létrehozott és/vagy vele kapcsolatos, őt érdeklő online tartalmak lementései)
- céges archívum (pl. egy adott vállalat által létrehozott és/vagy vele, illetve a versenytársaival/piacával kapcsolatos online tartalmak lementései)
- intézményi archívum (pl. egy könyvtár gyűjtőkörébe tartozó vagy egy kutatóintézet szakterületéhez kapcsolódó webes tartalmak gyűjteménye)
- országos archívum (pl. a nemzeti örökség hosszú távú megőrzése céljából a nemzeti könyvtár vagy levéltár vagy valamilyen konzorcium által fenntartott archívum)
A tárolási mód szerint
- fájlrendszerbe mentés (a weboldalt alkotó fájlok egyenkénti tárolása, az eredeti fájlnevek megőrzésével vagy átnevezésével, és a linkek relatívvá tételével, hogy az archív példány is navigálható maradjon)
- archív állományba mentés (a weboldalakat alkotó objektumoknak és azok technikai metaadatainak nagy fájlokba mentése pl. WARC formátumú csomagokat képezve)
- egységes formátumba mentés (a weboldalak tartalmának és/vagy kinézetének megőrzése azok eredeti szerkezetének megtartása nélkül, pl. egységesen XML formátumra konvertálva, vagy PDF/A fájlba "nyomtatva" őket, vagy pl. PNG képeket készítve róluk)
- adatbázisba mentés (elsősorban nem webhelyek, hanem pl. elektronikus levelek, tweetek, blogbejegyzések, Facebook-postok, hírportálokról letöltött cikkek stb. adatbázis-rekordokként való tárolása)
A mentés módja szerint
- aratással (egy crawler végzi a gyűjtést az eredeti webhelyről vagy a szolgáltató által "crawler-baráttá" tett felületről vagy RSS-feedről – beállított paraméterek szerint követve a linkeket és archív csomagokat képezve)
- letöltőalkalmazással (egy weboldalak lementésére készült szoftverrel vagy böngészőkiegészítővel adott weboldal, vagy adott webhely, vagy adott URL címlista lementése, rendszerint fájlrendszerbe)
- push technikával (a tartalmat vagy az eredeti szolgáltató szerver küldi be az archívumba, valamilyen szabványos adatcsere protokollon keresztül, pl. rendszeresen tükrözve a teljes site-ot/adatbázist vagy annak XML-be kimentett tartalmát, ill. csak az újdonságokat/változásokat, vagy valamilyen proxy szerver küld be egy másolatot az archívumba minden rajta áthaladó (a felhasználók kliensei által kért) digitális objektumból.
- depozitként (az eredeti tartalomgazdák valamilyen offline hordozón adják be alkalmanként a webhelyük tartalmának aktuális másolatát, vagy egy személy/örököse küldi be az online anyagait digitális hagyatékként)
Gyakoriság és idődimenzió szerint
- ismétlődő mentések hosszú távú megőrzéssel (egy-egy website rendszeres mentése, lehetőleg a webhely változékonyságához optimalizálva, adott időpontbeli állapot visszaállításának lehetőségével, hosszú távra tervezve)
- ismétlődő mentések az utolsó állapotot megőrizve (egy-egy website rendszeres mentése, de a korábbi változatok megőrzése nélkül, pl. a keresőrendszerek számára szükséges indexeléshez, vagy pl. egy piaci szegmens aktuális állapotát kutató adatbányászathoz)
- egyedi vagy alkalmi mentések (egy-egy webhely, vagy weblap, vagy webkettes tartalom, vagy dokumentum egyszeri vagy alkalomszerű mentése (pl. hogy egy publikációban stabil URI-val lehessen rá hivatkozni, vagy hogy bizonyítékként felhasználható legyen egy jogi eljárásban)