„Nettarkivet (norvég)” változatai közötti eltérés
9. sor: | 9. sor: | ||
* [https://www.nb.no/samlingen/nettarkivet/ A Nettarkivet weblapja a nemzeti könyvtár honlapján] |
* [https://www.nb.no/samlingen/nettarkivet/ A Nettarkivet weblapja a nemzeti könyvtár honlapján] |
||
* [https://github.com/nlnwa A Norsk nettarkiv szoftverei a GitHub-on] |
* [https://github.com/nlnwa A Norsk nettarkiv szoftverei a GitHub-on] |
||
+ | * [https://www.arkivrad.no/sites/arkivrad/files/user/Arkivraad/5_gretel_westman_presentasjon_norsk_arkivrad.pdf 2016-os prezentáció a norvég webarchívumról] |
||
[[Category:PROJEKTEK]] |
[[Category:PROJEKTEK]] |
A lap jelenlegi, 2020. december 22., 09:25-kori változata
A Paradigma projekt folytatásaként működő norvég webarchívum. A Paradigma projekt 2004 végén lezárult, de a webarchiválás folytatódott egészen 2008-ig, amikor az adatvédelmi biztos megkérdőjelezte a teljes körű aratás jogosságát (bár korábban kapott rá időszakos engedélyt a könyvtár). Ezért ezután csak válogatott site-okat mentettek a Heritrix-szel a Web Curator Tool keretrendszert használva (500-2500 közötti számban), előzetes engedélykérések után.
2016 januártól viszont változott a kötelespéldány szabályozás és ez már megengedi a teljes norvég webtér aratását a nemzeti könyvtárnak, valamint a kutatási és dokumentációs célú hozzáférést, sőt az állami webhelyek esetében engedélykérésre sincs szükség. Ezért a Nasjonalbiblioteket újratervezte a webarchiváló rendszerét és többek között egy Chrome-alapú crawler-t is kifejlesztett hozzá Veidemann néven. A .no domainről és a máshol levő norvég nyelvű weboldalakról 2018-ban tervezik újraindítani a teljes körű aratást. (A nyelvfelismeréshez is saját eszközt készítettek.) A szolgáltatás az Open Wayback-kel történik majd részben nyilvánosan, részben házon belül ill. egyetemi/főiskolai könyvtárak termináljairól, de még a felhasználói felület nem készült el. Ha nincs felelős szerkesztő vagy tulajdonos, akitől engedélyt lehetne kérni, vagy ha érzékeny személyes adatok vannak a webhelyen, akkor az csak a nemzeti könyvtár dedikált termináljain férhető hozzá, a könyvtár engedélyével. Külön kategóriát jelentenek a szuper-érzékeny személyes adatokkal bíró honlapok, melyek a jövőre nézve információértékkel bírnak. Ezeket csak a titokgazdával és a nemzeti könyvtárral kötött megállapodás alapján lehet megnézni.
Egy 2018 októberi cikk szerint a norvég webarchívum már 24 milliárd weboldalt (fájlt?) tartalmazott.