„WARC” változatai közötti eltérés

Innen: MIA
(Új oldal, tartalma: „= (Web ARChive) = A crawler által begyűjtött digitális objektumok és metaadataik tárolására szolgáló formátum. Az eredetileg az Internet Archive ál…”)
 
 
(2 közbenső módosítás ugyanattól a szerkesztőtől nincs mutatva)
1. sor: 1. sor:
 
= (Web ARChive) =
 
= (Web ARChive) =
   
A [[crawler]] által begyűjtött digitális objektumok és metaadataik tárolására szolgáló formátum. Az eredetileg az [[Internet Archive]] által bevezetett [[ARC]] fájltípus továbbfejlesztett változata, szabványos (ISO 28500), nyílt formátum. A WARC fájl egy olyan (jellemzően nagyméretű) csomag, amely egy vagy több WARC rekordot tartalmaz (ezeknek 8 fajtája létezik), melyek mindegyike egy header-ből és egy content block-ból áll. Utóbbiban bármilyen fájltípus tárolható.
+
A [[crawler]] által begyűjtött digitális objektumok és metaadataik tárolására szolgáló formátum. Az eredetileg az [[Internet Archive]] által bevezetett [[ARC]] fájltípus továbbfejlesztett változata, 2009-ben szabványosított ([[ISO 28500:2009|ISO 28500]]), nyílt formátum. A WARC fájl egy olyan (jellemzően nagyméretű) csomag, amely egy vagy több WARC rekordot tartalmaz (ezeknek 8 fajtája létezik), melyek mindegyike egy header-ből és egy content block-ból áll. Utóbbiban bármilyen fájltípus tárolható.
   
 
----
 
----
10. sor: 10. sor:
 
* [https://webarchive.jira.com/wiki/display/Iresearch/Web+Archive+Metadata+File+Specification Web Archive Metadata File Specification]
 
* [https://webarchive.jira.com/wiki/display/Iresearch/Web+Archive+Metadata+File+Specification Web Archive Metadata File Specification]
 
* [http://www.netpreserve.org/resources/warc-implementation-guidelines-v1 WARC implementation guidelines]
 
* [http://www.netpreserve.org/resources/warc-implementation-guidelines-v1 WARC implementation guidelines]
  +
* [https://netpreserveblog.wordpress.com/2019/05/29/warc-10th-anniversary/ Sara Aubry: The WARC file format celebrates its 10th anniversary]
   
 
[[Category:FORMÁTUMOK]]
 
[[Category:FORMÁTUMOK]]

A lap jelenlegi, 2024. május 24., 12:33-kori változata

(Web ARChive)

A crawler által begyűjtött digitális objektumok és metaadataik tárolására szolgáló formátum. Az eredetileg az Internet Archive által bevezetett ARC fájltípus továbbfejlesztett változata, 2009-ben szabványosított (ISO 28500), nyílt formátum. A WARC fájl egy olyan (jellemzően nagyméretű) csomag, amely egy vagy több WARC rekordot tartalmaz (ezeknek 8 fajtája létezik), melyek mindegyike egy header-ből és egy content block-ból áll. Utóbbiban bármilyen fájltípus tárolható.