„Nettarkivet (norvég)” változatai közötti eltérés
a (Admin átnevezte a(z) Nettarkivet Norge lapot a következő névre: Nettarkivet (norvég)) |
|||
(4 közbenső módosítás, amit egy másik szerkesztő végzett, nincs mutatva) | |||
1. sor: | 1. sor: | ||
+ | A [[Paradigma (norvég)|Paradigma]] projekt folytatásaként működő norvég webarchívum. A Paradigma projekt 2004 végén lezárult, de a webarchiválás folytatódott egészen 2008-ig, amikor az adatvédelmi biztos megkérdőjelezte a teljes körű aratás jogosságát (bár korábban kapott rá időszakos engedélyt a könyvtár). Ezért ezután csak válogatott site-okat mentettek a [[Heritrix]]-szel a [[WCT|Web Curator Tool]] keretrendszert használva (500-2500 közötti számban), előzetes engedélykérések után. |
||
− | Lásd: [[Paradigma (norvég)]] |
||
+ | |||
+ | 2016 januártól viszont változott a kötelespéldány szabályozás és ez már megengedi a teljes norvég webtér aratását a nemzeti könyvtárnak, valamint a kutatási és dokumentációs célú hozzáférést, sőt az állami webhelyek esetében engedélykérésre sincs szükség. Ezért a Nasjonalbiblioteket újratervezte a webarchiváló rendszerét és többek között egy Chrome-alapú [[crawler]]-t is kifejlesztett hozzá [[Veidemann]] néven. A .no domainről és a máshol levő norvég nyelvű weboldalakról 2018-ban tervezik újraindítani a teljes körű aratást. (A nyelvfelismeréshez is saját eszközt készítettek.) A szolgáltatás az [[Wayback|Open Wayback]]-kel történik majd részben nyilvánosan, részben házon belül ill. egyetemi/főiskolai könyvtárak termináljairól, de még a felhasználói felület nem készült el. Ha nincs felelős szerkesztő vagy tulajdonos, akitől engedélyt lehetne kérni, vagy ha érzékeny személyes adatok vannak a webhelyen, akkor az csak a nemzeti könyvtár dedikált termináljain férhető hozzá, a könyvtár engedélyével. Külön kategóriát jelentenek a szuper-érzékeny személyes adatokkal bíró honlapok, melyek a jövőre nézve információértékkel bírnak. Ezeket csak a titokgazdával és a nemzeti könyvtárral kötött megállapodás alapján lehet megnézni. |
||
+ | |||
+ | Egy 2018 októberi cikk szerint a norvég webarchívum már 24 milliárd weboldalt (fájlt?) tartalmazott. |
||
+ | |||
+ | ---- |
||
+ | |||
+ | * [https://www.nb.no/samlingen/nettarkivet/ A Nettarkivet weblapja a nemzeti könyvtár honlapján] |
||
+ | * [https://github.com/nlnwa A Norsk nettarkiv szoftverei a GitHub-on] |
||
+ | * [https://www.arkivrad.no/sites/arkivrad/files/user/Arkivraad/5_gretel_westman_presentasjon_norsk_arkivrad.pdf 2016-os prezentáció a norvég webarchívumról] |
||
[[Category:PROJEKTEK]] |
[[Category:PROJEKTEK]] |
||
+ | [[Category:NEMZETI PROJEKTEK]] |
A lap jelenlegi, 2020. december 22., 09:25-kori változata
A Paradigma projekt folytatásaként működő norvég webarchívum. A Paradigma projekt 2004 végén lezárult, de a webarchiválás folytatódott egészen 2008-ig, amikor az adatvédelmi biztos megkérdőjelezte a teljes körű aratás jogosságát (bár korábban kapott rá időszakos engedélyt a könyvtár). Ezért ezután csak válogatott site-okat mentettek a Heritrix-szel a Web Curator Tool keretrendszert használva (500-2500 közötti számban), előzetes engedélykérések után.
2016 januártól viszont változott a kötelespéldány szabályozás és ez már megengedi a teljes norvég webtér aratását a nemzeti könyvtárnak, valamint a kutatási és dokumentációs célú hozzáférést, sőt az állami webhelyek esetében engedélykérésre sincs szükség. Ezért a Nasjonalbiblioteket újratervezte a webarchiváló rendszerét és többek között egy Chrome-alapú crawler-t is kifejlesztett hozzá Veidemann néven. A .no domainről és a máshol levő norvég nyelvű weboldalakról 2018-ban tervezik újraindítani a teljes körű aratást. (A nyelvfelismeréshez is saját eszközt készítettek.) A szolgáltatás az Open Wayback-kel történik majd részben nyilvánosan, részben házon belül ill. egyetemi/főiskolai könyvtárak termináljairól, de még a felhasználói felület nem készült el. Ha nincs felelős szerkesztő vagy tulajdonos, akitől engedélyt lehetne kérni, vagy ha érzékeny személyes adatok vannak a webhelyen, akkor az csak a nemzeti könyvtár dedikált termináljain férhető hozzá, a könyvtár engedélyével. Külön kategóriát jelentenek a szuper-érzékeny személyes adatokkal bíró honlapok, melyek a jövőre nézve információértékkel bírnak. Ezeket csak a titokgazdával és a nemzeti könyvtárral kötött megállapodás alapján lehet megnézni.
Egy 2018 októberi cikk szerint a norvég webarchívum már 24 milliárd weboldalt (fájlt?) tartalmazott.