LoC Twitter Archive

Innen: MIA

A Library of Congress 2010-ben megállapodott a Twitterrel az összes nyilvános tweet archiválásáról. A legfeljebb 140 karakterből álló rövid webes üzeneteket 2006 márciusáig (ekkor indult a Twitter) visszamenőleg is megkapta a könyvtár, előremenetben pedig folyamatosan átveszi az újakat. A LoC hat hónapos embargót vállalt és azt, hogy a törölt vagy priváttá tett tweet-eket nem szolgáltatja. A szerződés megkötésekor a napi gyarapodás elérte az 50 milliót, de ez az átlagérték 2014-re megtízszereződött. 2013 elején a LOC kiadott egy tájékoztatást a projekt állásáról. Eszerint a 2006-2010 közötti, 170 milliárd tételes archív állomány mérete 133,2 terabájt lett (nemcsak az üzenetek szövegét, hanem a bennük levő linkeket és több mint 100-féle metaadatot is tárolni kell), s megoldották a bejövő, "élő" üzenetfolyam biztonságos és fenntartható fogadását és őrzését is a Gnip nevű - a közösségi médiából származó adatok aggregálásával foglalkozó - vállalaton keresztül (melyet 2014-ben a Twitter felvásárolt). Közölték azt is, hogy további magáncégek bevonására lesz szükség a technikai és infrastrukturális problémák kezeléséhez, melyek miatt egyelőre nem tudnak hozzáférést biztosítani az archívumhoz (mert pl. egyetlen keresés lefuttatása egy napig tart). 2014 közepére ígértek egy kísérleti szolgáltatást, de az azóta sem készült el, a technikai és jogi kérdések megoldatlansága miatt továbbra is elérhetetlen a LoC Twitter archívuma.