„Warc-metadata-sidecar” változatai közötti eltérés
(Új oldal, tartalma: „A University of North Texas Libraries munkatársai által írt Python könyvtár, amivel WARC vagy ARC konténerekből kigyűjthetők bizonyos típusú metaadat…”) |
|||
1. sor: | 1. sor: | ||
− | A University of North Texas Libraries munkatársai által írt Python könyvtár, amivel [[WARC]] vagy [[ARC]] konténerekből kigyűjthetők bizonyos típusú metaadatok egy [eredeti-fájlnév].warc.meta.gz nevű, [[WARC Metadata Sidecar]] formátumú kísérőfájlba. Ez azután akár CDXJ formátumra is konvertálható és összefésülhető az eredeti WARC-hoz tartozó CDXJ |
+ | A University of North Texas Libraries munkatársai által írt Python könyvtár, amivel [[WARC]] vagy [[ARC]] konténerekből kigyűjthetők bizonyos típusú metaadatok egy [eredeti-fájlnév].warc.meta.gz nevű, [[WARC Metadata Sidecar]] formátumú kísérőfájlba. Ez azután akár CDXJ formátumra is konvertálható és összefésülhető az eredeti WARC-hoz tartozó CDXJ indexszel. |
---- |
---- |
A lap 2024. május 12., 15:22-kori változata
A University of North Texas Libraries munkatársai által írt Python könyvtár, amivel WARC vagy ARC konténerekből kigyűjthetők bizonyos típusú metaadatok egy [eredeti-fájlnév].warc.meta.gz nevű, WARC Metadata Sidecar formátumú kísérőfájlba. Ez azután akár CDXJ formátumra is konvertálható és összefésülhető az eredeti WARC-hoz tartozó CDXJ indexszel.