Virginia Tech Events Archive

Innen: MIA
A lap korábbi változatát látod, amilyen Admin (vitalap | szerkesztései) 2018. március 21., 17:26-kor történt szerkesztése után volt.

A Virginia Polytechnic Institute and State University (röviden: Virginia Tech) eseményalapú web- és Twitter-archívuma. Különböző válságok, katasztrófák és tragédiák (pl. iskolai lövöldözések) internetes lenyomatait gyűjtik az egész világból. (2015 szeptemberi adatok szerint 12 terabájt webanyag és több mint 1 milliárd tweet volt benne.) Részben az Archive-It szolgáltatást használják (2018 elején 66 eseményalapú részgyűjteményük volt), részben maguk is gyűjtenek a Heritrix-szel és más eszközökkel (köztük egy saját fejlesztésű focused crawlerrel), valamint a DMI-TCAT, a yourTwapperKeeper és a Social Feed Manager nevű Twitter-elemző és -archiváló eszközöket is használják. Az így összegyűlt adathalmazon különböző információkeresési, szövegbányászati, hálózatelemzési, számítógépes nyelvészeti, gépi tanulási, vizualizációs stb. kutatásokat is végeznek egy Hadoop klaszteren.

Az archívum létrehozásának kiváltó oka a 2007 április 16-án az egyetemen történt, 32 halálos áldozattal járó lövöldözés volt. Ennek az eseménynek a kutatásához hozták létre az első gyűjteményt. Ezt követően 2009 és 2013 között a CTRnet (Crisis, Tragedy, and Recovery Network) projekt keretében folyt tovább a munka, majd egy újabb 4 éves projektbe kezdtek IDEAL (Integrated Digital Event Archiving and Library) néven. 2016 végétől pedig a GETAR (Global Event and Trend Archive Research) - szintén a National Science Foundation által finanszírozott - pályázatuk keretében végzik az eseményalapú archiválást és a begyűjtött digitális tartalmak feldolgozását.