„Virginia Tech Events Archive” változatai közötti eltérés
1. sor: | 1. sor: | ||
− | A Virginia Polytechnic Institute and State University (röviden: Virginia Tech) eseményalapú web- és Twitter-archívuma. Különböző válságok, katasztrófák és tragédiák (pl. iskolai lövöldözések) internetes lenyomatait gyűjtik az egész világból. (2015 szeptemberi adatok szerint 12 terabájt webanyag és több mint 1 milliárd tweet volt benne.) Részben az [[Archive-It]] szolgáltatást használják (2018 elején 66 eseményalapú részgyűjteményük volt), részben maguk is gyűjtenek a [[Heritrix]]-szel és más eszközökkel (köztük egy saját fejlesztésű [[focused crawler]]rel), valamint a [[DMI-TCAT]], a |
+ | A Virginia Polytechnic Institute and State University (röviden: Virginia Tech) eseményalapú web- és Twitter-archívuma. Különböző válságok, katasztrófák és tragédiák (pl. iskolai lövöldözések) internetes lenyomatait gyűjtik az egész világból. (2015 szeptemberi adatok szerint 12 terabájt webanyag és több mint 1 milliárd tweet volt benne.) Részben az [[Archive-It]] szolgáltatást használják (2018 elején 66 eseményalapú részgyűjteményük volt), részben maguk is gyűjtenek a [[Heritrix]]-szel és más eszközökkel (köztük egy saját fejlesztésű [[focused crawler]]rel), valamint a [[DMI-TCAT]], a yourTwapperKeeper és a [[Social Feed Manager]] nevű Twitter-elemző és -archiváló eszközöket is használják. Az így összegyűlt adathalmazon különböző információkeresési, szövegbányászati, hálózatelemzési, számítógépes nyelvészeti, gépi tanulási, vizualizációs stb. kutatásokat is végeznek egy [[Hadoop]] klaszteren. |
Az archívum létrehozásának kiváltó oka a 2007 április 16-án az egyetemen történt, 32 halálos áldozattal járó lövöldözés volt. Ennek az eseménynek a kutatásához hozták létre az első gyűjteményt. Ezt követően 2009 és 2013 között a CTRnet (Crisis, Tragedy, and Recovery Network) projekt keretében folyt tovább a munka, majd egy újabb 4 éves projektbe kezdtek IDEAL (Integrated Digital Event Archiving and Library) néven. 2016 végétől pedig a GETAR (Global Event and Trend Archive Research) - szintén a National Science Foundation által finanszírozott - pályázatuk keretében végzik az eseményalapú archiválást és a begyűjtött digitális tartalmak feldolgozását. |
Az archívum létrehozásának kiváltó oka a 2007 április 16-án az egyetemen történt, 32 halálos áldozattal járó lövöldözés volt. Ennek az eseménynek a kutatásához hozták létre az első gyűjteményt. Ezt követően 2009 és 2013 között a CTRnet (Crisis, Tragedy, and Recovery Network) projekt keretében folyt tovább a munka, majd egy újabb 4 éves projektbe kezdtek IDEAL (Integrated Digital Event Archiving and Library) néven. 2016 végétől pedig a GETAR (Global Event and Trend Archive Research) - szintén a National Science Foundation által finanszírozott - pályázatuk keretében végzik az eseményalapú archiválást és a begyűjtött digitális tartalmak feldolgozását. |
A lap 2018. március 21., 16:26-kori változata
A Virginia Polytechnic Institute and State University (röviden: Virginia Tech) eseményalapú web- és Twitter-archívuma. Különböző válságok, katasztrófák és tragédiák (pl. iskolai lövöldözések) internetes lenyomatait gyűjtik az egész világból. (2015 szeptemberi adatok szerint 12 terabájt webanyag és több mint 1 milliárd tweet volt benne.) Részben az Archive-It szolgáltatást használják (2018 elején 66 eseményalapú részgyűjteményük volt), részben maguk is gyűjtenek a Heritrix-szel és más eszközökkel (köztük egy saját fejlesztésű focused crawlerrel), valamint a DMI-TCAT, a yourTwapperKeeper és a Social Feed Manager nevű Twitter-elemző és -archiváló eszközöket is használják. Az így összegyűlt adathalmazon különböző információkeresési, szövegbányászati, hálózatelemzési, számítógépes nyelvészeti, gépi tanulási, vizualizációs stb. kutatásokat is végeznek egy Hadoop klaszteren.
Az archívum létrehozásának kiváltó oka a 2007 április 16-án az egyetemen történt, 32 halálos áldozattal járó lövöldözés volt. Ennek az eseménynek a kutatásához hozták létre az első gyűjteményt. Ezt követően 2009 és 2013 között a CTRnet (Crisis, Tragedy, and Recovery Network) projekt keretében folyt tovább a munka, majd egy újabb 4 éves projektbe kezdtek IDEAL (Integrated Digital Event Archiving and Library) néven. 2016 végétől pedig a GETAR (Global Event and Trend Archive Research) - szintén a National Science Foundation által finanszírozott - pályázatuk keretében végzik az eseményalapú archiválást és a begyűjtött digitális tartalmak feldolgozását.