WANE

Innen: MIA

(Web Archive Named Entities)

A Stanford Named Entity Recognizer szoftver segítségével egy webarchívumból kinyert személy-, intézmény- és földrajzi neveket, valamint az őket tartalmazó weblapok vagy egyéb szöveges dokumentumok URL címeit és a mentés időpontját tartalmazó, JSON formátumú fájl. Minden WARC fájlból készíthető egy ilyen WANE fájl, ami azután felhasználható különböző statisztikai elemzésekhez, összekapcsolható névterekkel, vagy pl. a Wikipédiával.