„Warc-metadata-sidecar” változatai közötti eltérés

Innen: MIA
(Új oldal, tartalma: „A University of North Texas Libraries munkatársai által írt Python könyvtár, amivel WARC vagy ARC konténerekből kigyűjthetők bizonyos típusú metaadat…”)
 
 
(Egy közbenső módosítás ugyanattól a szerkesztőtől nincs mutatva)
1. sor: 1. sor:
A University of North Texas Libraries munkatársai által írt Python könyvtár, amivel [[WARC]] vagy [[ARC]] konténerekből kigyűjthetők bizonyos típusú metaadatok egy [eredeti-fájlnév].warc.meta.gz nevű, [[WARC Metadata Sidecar]] formátumú kísérőfájlba. Ez azután akár CDXJ formátumra is konvertálható és összefésülhető az eredeti WARC-hoz tartozó CDXJ indexxel.
+
A University of North Texas Libraries munkatársai által írt Python könyvtár, amivel [[WARC]] vagy [[ARC]] konténerekből kigyűjthetők bizonyos típusú metaadatok egy [eredeti-fájlnév].warc.meta.gz nevű, [[WARC Metadata Sidecar]] formátumú kísérőfájlba. Ez azután akár CDXJ formátumra is konvertálható és összefésülhető az eredeti WARC-hoz tartozó CDXJ indexszel.
   
 
----
 
----
   
 
* [https://github.com/unt-libraries/warc-metadata-sidecar A warc-metadata-sidecar a GitHub-on]
 
* [https://github.com/unt-libraries/warc-metadata-sidecar A warc-metadata-sidecar a GitHub-on]
* [https://www.ideals.illinois.edu/items/128295 Mark E. Phillips - Kristy K. Phillips - Sawood Alam: Content-Based Characterization of the End of Term Web Archive]
+
* [https://www.ideals.illinois.edu/items/128295 Mark E. Phillips - Kristy K. Phillips - Sawood Alam: Content-Based Characterization of the End of Term Web Archive]
   
 
[[Category:SZOFTVEREK]]
 
[[Category:SZOFTVEREK]]

A lap jelenlegi, 2024. május 12., 18:34-kori változata

A University of North Texas Libraries munkatársai által írt Python könyvtár, amivel WARC vagy ARC konténerekből kigyűjthetők bizonyos típusú metaadatok egy [eredeti-fájlnév].warc.meta.gz nevű, WARC Metadata Sidecar formátumú kísérőfájlba. Ez azután akár CDXJ formátumra is konvertálható és összefésülhető az eredeti WARC-hoz tartozó CDXJ indexszel.