„WARC” változatai közötti eltérés

Innen: MIA
 
10. sor: 10. sor:
 
* [https://webarchive.jira.com/wiki/display/Iresearch/Web+Archive+Metadata+File+Specification Web Archive Metadata File Specification]
 
* [https://webarchive.jira.com/wiki/display/Iresearch/Web+Archive+Metadata+File+Specification Web Archive Metadata File Specification]
 
* [http://www.netpreserve.org/resources/warc-implementation-guidelines-v1 WARC implementation guidelines]
 
* [http://www.netpreserve.org/resources/warc-implementation-guidelines-v1 WARC implementation guidelines]
  +
* [https://netpreserveblog.wordpress.com/2019/05/29/warc-10th-anniversary/ Sara Aubry: The WARC file format celebrates its 10th anniversary]
   
 
[[Category:FORMÁTUMOK]]
 
[[Category:FORMÁTUMOK]]

A lap jelenlegi, 2024. május 24., 13:33-kori változata

(Web ARChive)

A crawler által begyűjtött digitális objektumok és metaadataik tárolására szolgáló formátum. Az eredetileg az Internet Archive által bevezetett ARC fájltípus továbbfejlesztett változata, 2009-ben szabványosított (ISO 28500), nyílt formátum. A WARC fájl egy olyan (jellemzően nagyméretű) csomag, amely egy vagy több WARC rekordot tartalmaz (ezeknek 8 fajtája létezik), melyek mindegyike egy header-ből és egy content block-ból áll. Utóbbiban bármilyen fájltípus tárolható.