„Metawarc” változatai közötti eltérés
(Új oldal, tartalma: „{{DISPLAYTITLE:metawarc}} Örmény programozó által Pythonban írt open source program, mellyel a parancssori paramétereknek megfelelő fájlok technikai metaadatai…”) |
|||
(Egy közbenső módosítás ugyanattól a szerkesztőtől nincs mutatva) | |||
1. sor: | 1. sor: | ||
{{DISPLAYTITLE:metawarc}} |
{{DISPLAYTITLE:metawarc}} |
||
+ | Örmény programozó által Pythonban írt open source program, mellyel a parancssori paramétereknek megfelelő fájlok technikai metaadatai gyűjthetők ki [[WARC]] konténerekből. A fájlok formátuma megadható MIME típusként, de fájlvégződésként is (pl.: .docx, .xlsx, .pptx., .pdf, .png, .jpg). A kigyűjtött adatok JSON vagy NDJSON (Newline Delimited JSON) szöveges állományokba vagy közvetlenül SQLite adatbázisba menthetők. A metaadatokon kívül a nyers szövegek, vagy akár maguk az eredeti fájlok is kiszedhetők vele a WARC-okból. |
||
− | |||
− | Örmény programozó által Pythonban írt open source program, mellyel a parancssori paramétereknek megfelelő fájlok technikai metaadatai gyűjthetők ki [[WARC]] konténerekből. A fájlok formátuma megadható MIME típusként, de fájlvégződésként is (pl.: .docx, .xlsx, .pptx., .pdf, .png, .jpg). A kigyűjtött adatok JSON vagy NDJSON (JSON lines) szöveges állományokba vagy közvetlenül SQLite adatbázisba menthetők. A metaadatokon kívül a nyers szövegek, vagy akár maguk az eredeti fájlok is kiszedhetők vele a WARC-okból. |
||
---- |
---- |
A lap jelenlegi, 2024. május 27., 15:56-kori változata
Örmény programozó által Pythonban írt open source program, mellyel a parancssori paramétereknek megfelelő fájlok technikai metaadatai gyűjthetők ki WARC konténerekből. A fájlok formátuma megadható MIME típusként, de fájlvégződésként is (pl.: .docx, .xlsx, .pptx., .pdf, .png, .jpg). A kigyűjtött adatok JSON vagy NDJSON (Newline Delimited JSON) szöveges állományokba vagy közvetlenül SQLite adatbázisba menthetők. A metaadatokon kívül a nyers szövegek, vagy akár maguk az eredeti fájlok is kiszedhetők vele a WARC-okból.