Internet Archive
1996-ban San Franciscóban Brewster Kahle által alapított nonprofit szervezet és archívum. A főként az Alexa Internet cég által gyűjtött tartalomból álló világméretű webarchívuma (ami a Wayback Machine felületen böngészhető) mellett szövegesdokumentum- (főként digitalizáltkönyv- és periodika-), kép-, hang-, videó- és szoftverarchívuma is van (ezeket részben nagy partnerektől kapják, részben a felhasználók töltik fel). Az Archive-It nevű szolgáltatásán keresztül megbízásra is végeznek webarchiválást több mint 450 könyvtár és egyéb intézmény számára, továbbá néhány nemzeti könyvtárnak domainszintű aratásokat is csinálnak.
Az archívum mérete 2024 augusztusában 145 petabájt, amely az alábbiakat foglalja magában:
- 835 milliárd webhely
- 44 millió könyv és egyéb szöveg
- 15 millió hangfelvétel (255 ezer teljes koncertfelvétellel)
- 10,6 millió videó (2,6 millió televíziós híradással)
- 4,8 millió kép
- 1 millió szoftver/program
Történeti adatok
- A webarchívum mérete 2017 júniusában 284 milliárd weboldal és heti 1 milliárddal gyarapodik.
- 2016 októberi adatok: 361 millió webhely, 273 milliárd weboldal, 510 milliárd digitális objektum, kb. 15 petabájt.) A teljes gyűjtemény (vagyis az összes médiatípus) tárhelyigénye 2017 közepén 32 petabájt (mindent legalább két példányban tárolnak).