ELTE MIA pilot

Innen: MIA

2010-es évek első felében a PetaByte Nonprofit Kutatási Kft. az ELTE Tudománytörténet és Tudományfilozófia Tanszékének tudománymetriai munkacsoportja számára végzett egy fókuszált webarchiválást. Mintegy 400 magyar webhelyet: MTA kutatóintézetek, NIIF tagintézmények, valamint egyetemek és főiskolák honlapjait mentették kéthetes periodicitással (főleg szövegeket, képeket és videókat archiváltak). A lementett tartalmat ki is elemezték például olyan szempontból, hogy mit kommunikálnak magukról az intézmények. A Heritrixnek egy saját igények szerint továbbfejlesztett változatával arattak egy Dell T710 szerveren (2x4 core Xeon E5520, 48GB RAM, 2TB HDD). 2014 elején az MTA intézetek teljes másolata 33 gigabájt volt (ebből 6,5 gigabájt a szöveg), az egyetemek és főiskolák anyaga pedig 53 gigabájt (ebből szöveg 36 gigabájt).