„WARC” változatai közötti eltérés
(→(Web ARChive)) |
|||
(Egy közbenső módosítás ugyanattól a szerkesztőtől nincs mutatva) | |||
1. sor: | 1. sor: | ||
= (Web ARChive) = |
= (Web ARChive) = |
||
− | A [[crawler]] által begyűjtött digitális objektumok és metaadataik tárolására szolgáló formátum. Az eredetileg az [[Internet Archive]] által bevezetett [[ARC]] fájltípus továbbfejlesztett változata, |
+ | A [[crawler]] által begyűjtött digitális objektumok és metaadataik tárolására szolgáló formátum. Az eredetileg az [[Internet Archive]] által bevezetett [[ARC]] fájltípus továbbfejlesztett változata, 2009-ben szabványosított ([[ISO 28500:2009|ISO 28500]]), nyílt formátum. A WARC fájl egy olyan (jellemzően nagyméretű) csomag, amely egy vagy több WARC rekordot tartalmaz (ezeknek 8 fajtája létezik), melyek mindegyike egy header-ből és egy content block-ból áll. Utóbbiban bármilyen fájltípus tárolható. |
---- |
---- |
||
10. sor: | 10. sor: | ||
* [https://webarchive.jira.com/wiki/display/Iresearch/Web+Archive+Metadata+File+Specification Web Archive Metadata File Specification] |
* [https://webarchive.jira.com/wiki/display/Iresearch/Web+Archive+Metadata+File+Specification Web Archive Metadata File Specification] |
||
* [http://www.netpreserve.org/resources/warc-implementation-guidelines-v1 WARC implementation guidelines] |
* [http://www.netpreserve.org/resources/warc-implementation-guidelines-v1 WARC implementation guidelines] |
||
+ | * [https://netpreserveblog.wordpress.com/2019/05/29/warc-10th-anniversary/ Sara Aubry: The WARC file format celebrates its 10th anniversary] |
||
[[Category:FORMÁTUMOK]] |
[[Category:FORMÁTUMOK]] |
A lap jelenlegi, 2024. május 24., 12:33-kori változata
(Web ARChive)
A crawler által begyűjtött digitális objektumok és metaadataik tárolására szolgáló formátum. Az eredetileg az Internet Archive által bevezetett ARC fájltípus továbbfejlesztett változata, 2009-ben szabványosított (ISO 28500), nyílt formátum. A WARC fájl egy olyan (jellemzően nagyméretű) csomag, amely egy vagy több WARC rekordot tartalmaz (ezeknek 8 fajtája létezik), melyek mindegyike egy header-ből és egy content block-ból áll. Utóbbiban bármilyen fájltípus tárolható.