„UKWA (brit)” változatai közötti eltérés

Innen: MIA
12. sor: 12. sor:
 
* [http://britishlibrary.typepad.co.uk/webarchive/ UK Web Archive blog]
 
* [http://britishlibrary.typepad.co.uk/webarchive/ UK Web Archive blog]
 
* [https://www.bl.uk/collection-guides/uk-web-archive UK Web Archive: About the collection]
 
* [https://www.bl.uk/collection-guides/uk-web-archive UK Web Archive: About the collection]
  +
* [https://www.llgc.org.uk/blog?p=16867 Aled Betts: The UK Web Archive: A New Chapter]
 
* [http://data.webarchive.org.uk/opendata/ UK Web Archive Open Data]
 
* [http://data.webarchive.org.uk/opendata/ UK Web Archive Open Data]
 
* [https://en.wikipedia.org/wiki/UK_Web_Archiving_Consortium#UK_Web_Archive Wikipedia: UK Web Archive]
 
* [https://en.wikipedia.org/wiki/UK_Web_Archiving_Consortium#UK_Web_Archive Wikipedia: UK Web Archive]
* [https://www.llgc.org.uk/blog?p=16867 Aled Betts: The UK Web Archive: A New Chapter]
 
   
 
[[Category:PROJEKTEK]]
 
[[Category:PROJEKTEK]]

A lap 2018. február 14., 11:39-kori változata

(UK Web Archive)

A 2004-ben alakult UKWAC együttműködés keretében létrejött brit webarchívum. Szelektív archiválással kezdtek, egyedi engedélyeket kérve egészen 2013-ig, a kötelespéldány törvény kiterjesztésig. Kezdetben a PANDAS és a HTTrack szoftvereket használták, de 2008-tól már a WCT-Heritrix párossal dolgoznak. Ekkorra 2,769 webhelyet (kevesebb, mint 2 terabájtot) mentettek le, tematikus és esemény-alapú válogatással. Az alacsony számok magyarázata részben a betanulási időszak és a PANDAS problémái, részben az alacsony válaszadási arány (2008-ban 6609 kiválasztott site-tól 7,476 engedélyt kértek, de csak 1,872 jött meg, 51 elutasítás mellett). 2013-ra már 13,500 webhely (61,900 instance\) volt az archívumban. A 2017 áprilisi adatok: 15,112 website (79,276 instance\), 28 terabájtnyi adat. Az anyagot előbb egy külső cég (Magus Research Ltd.) hostolta, majd a University of London Computing Centre, végül átkerült a British Library digitális objektumkezelő rendszerébe. A szolgáltatás nyilvános és a visszakereshetőség mellett különböző plusz funkciók, statisztikai elemző és vizualizációs megoldások is kapcsolódnak hozzá.

Az amerikai Internet Archive és a brit JISC (Joint Information Systems Committee) partneri kapcsolatának köszönhetően 1996-tól 2010-ig, majd 2011-től 2013-ig (egy 32 és egy 26 terabájtos csomagban WARC fájlokként) megkapták az IA-tól azt a részhalmazt, amely az Egyesült Királyság webhelyeinek anyaga (UK Web Domain Dataset). 2013-tól pedig saját maguk aratják az .uk domaint (Non-Print Legal Deposit UK Web Archive). Mindkét archívum jelenleg csak helyben használható a kötelespéldány törvény alá tartozó hat brit könyvtárban, de vizsgálják, hogy hogyan lehetne belőlük nyilvánossá tehető tartalmakat kinyerni.

A British Library három webarchívumában 2015-ben 8 millió mentés volt, több mint 160 terabájt méretben (tömörített tárolással). Egy 2017 júniusi előadás szerint a teljes méret már 400 terabájt.