„WANE” változatai közötti eltérés
(Új oldal, tartalma: „= (Web Archive Named Entities) = A Stanford Named Entity Recognizer szoftver segítségével egy webarchívumból kinyert személy-, intézmény- és földrajzi neveke…”) |
|||
1. sor: | 1. sor: | ||
= (Web Archive Named Entities) = |
= (Web Archive Named Entities) = |
||
− | A Stanford Named Entity Recognizer szoftver segítségével egy webarchívumból kinyert személy-, intézmény- és földrajzi neveket, valamint az őket tartalmazó weblapok vagy egyéb szöveges dokumentumok URL címeit és a mentés időpontját tartalmazó, JSON formátumú fájl. Minden [[WARC]] fájlból készíthető egy ilyen |
+ | A Stanford Named Entity Recognizer szoftver segítségével egy webarchívumból kinyert személy-, intézmény- és földrajzi neveket, valamint az őket tartalmazó weblapok vagy egyéb szöveges dokumentumok URL címeit és a mentés időpontját tartalmazó, JSON formátumú fájl. Minden [[WARC]] fájlból készíthető egy ilyen WANE fájl, ami azután felhasználható különböző statisztikai elemzésekhez, összekapcsolható névterekkel, vagy pl. a Wikipédiával. |
---- |
---- |
A lap jelenlegi, 2017. július 23., 16:47-kori változata
(Web Archive Named Entities)
A Stanford Named Entity Recognizer szoftver segítségével egy webarchívumból kinyert személy-, intézmény- és földrajzi neveket, valamint az őket tartalmazó weblapok vagy egyéb szöveges dokumentumok URL címeit és a mentés időpontját tartalmazó, JSON formátumú fájl. Minden WARC fájlból készíthető egy ilyen WANE fájl, ami azután felhasználható különböző statisztikai elemzésekhez, összekapcsolható névterekkel, vagy pl. a Wikipédiával.