Webtér szintű aratások

A szelektív (tematikus és esemény alapú) aratások mellett évente egy-két alkalommal igyekszünk a magyar webtér minél nagyobb részéről egy “pillanatfelvételt” készíteni, vagyis néhány nap alatt lementeni több százezer honlapot a kezdőoldaltól kiindulva legalább két szint mélységig – helytakarékossági okokból a nagy méretű fájlokat kizárva. A kiindulásként használt URL-ek több forrásból származnak: a .hu országdomén alá bejegyzett publikus címlisták, a korábbi aratásokban talált linkekből kigyűjtött magyar domének és aldomének, valamint a tematikus részgyűjteményekhez emberi közreműködéssel összeválogatott vagy az ajánló űrlapon át érkezett (nemcsak .hu végű) honlapcímek.

Az alábbi táblázat az eddig lezajlott webtér szintű aratásokat tartalmazza. Ezeknek az anyaga is a zárt archívumba kerül hosszú távú megőrzés és kutatás céljából.

 

 

 

Aratás kezdete Aratás vége         Kiinduló URL-ek száma Letöltött URL-ek száma
2018-09-24 2018-09-28 291 078 172 639 350
2019-12-23 2020-01-02 246 819 110 367 190