„Warc-metadata-sidecar” változatai közötti eltérés

Innen: MIA
(Új oldal, tartalma: „A University of North Texas Libraries munkatársai által írt Python könyvtár, amivel WARC vagy ARC konténerekből kigyűjthetők bizonyos típusú metaadat…”)
 
1. sor: 1. sor:
A University of North Texas Libraries munkatársai által írt Python könyvtár, amivel [[WARC]] vagy [[ARC]] konténerekből kigyűjthetők bizonyos típusú metaadatok egy [eredeti-fájlnév].warc.meta.gz nevű, [[WARC Metadata Sidecar]] formátumú kísérőfájlba. Ez azután akár CDXJ formátumra is konvertálható és összefésülhető az eredeti WARC-hoz tartozó CDXJ indexxel.
+
A University of North Texas Libraries munkatársai által írt Python könyvtár, amivel [[WARC]] vagy [[ARC]] konténerekből kigyűjthetők bizonyos típusú metaadatok egy [eredeti-fájlnév].warc.meta.gz nevű, [[WARC Metadata Sidecar]] formátumú kísérőfájlba. Ez azután akár CDXJ formátumra is konvertálható és összefésülhető az eredeti WARC-hoz tartozó CDXJ indexszel.
   
 
----
 
----

A lap 2024. május 12., 15:22-kori változata

A University of North Texas Libraries munkatársai által írt Python könyvtár, amivel WARC vagy ARC konténerekből kigyűjthetők bizonyos típusú metaadatok egy [eredeti-fájlnév].warc.meta.gz nevű, WARC Metadata Sidecar formátumú kísérőfájlba. Ez azután akár CDXJ formátumra is konvertálható és összefésülhető az eredeti WARC-hoz tartozó CDXJ indexszel.