GDELT

Innen: MIA

(Global Database of Events, Language, and Tone)

A világ legnagyobb híradatbázisa, ami 1979-ig visszamenőleg több mint 300 kategóriában negyedmilliárdnál is több eseménnyel kapcsolatban tartalmaz adatokat, melyek ZIP csomagokban le is tölthetők, illetve a Google felhőjében a BigQuery szolgáltatással elemezhetők. Mintegy 100 nyelven, százezernyi nyomtatott, sugárzott és online hírforrást figyelnek és elemeznek ki folyamatosan. 2014-ben a GDELT csatlakozott az Internet Archive "No More 404" nevű programjához és azóta átadja a hírekhez tartozó, ill. a bennük talált URL címeket archiválás végett. 2017 novemberéig kb. 5.4 milliárd szöveg-, kép- és egyéb fájlt mentett le így az IA, összesen 221 terabájt méretben, melyek másnap már el is érhetők a Wayback Machine-ben.