<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="hu">
	<id>https://webarchivum.oszk.hu/mediawiki/api.php?action=feedcontributions&amp;feedformat=atom&amp;user=Gyula</id>
	<title>MIA - Szerkesztő közreműködései [hu]</title>
	<link rel="self" type="application/atom+xml" href="https://webarchivum.oszk.hu/mediawiki/api.php?action=feedcontributions&amp;feedformat=atom&amp;user=Gyula"/>
	<link rel="alternate" type="text/html" href="https://webarchivum.oszk.hu/mediawiki/index.php?title=Speci%C3%A1lis:Szerkeszt%C5%91_k%C3%B6zrem%C5%B1k%C3%B6d%C3%A9sei/Gyula"/>
	<updated>2026-05-05T05:30:11Z</updated>
	<subtitle>Szerkesztő közreműködései</subtitle>
	<generator>MediaWiki 1.31.16</generator>
	<entry>
		<id>https://webarchivum.oszk.hu/mediawiki/index.php?title=Brozzler&amp;diff=2020</id>
		<title>Brozzler</title>
		<link rel="alternate" type="text/html" href="https://webarchivum.oszk.hu/mediawiki/index.php?title=Brozzler&amp;diff=2020"/>
		<updated>2025-04-29T14:14:59Z</updated>

		<summary type="html">&lt;p&gt;Gyula: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= (browser | crawler &amp;lt;nowiki&amp;gt;=&amp;lt;/nowiki&amp;gt; brozzler) =&lt;br /&gt;
&lt;br /&gt;
Az Internet Archive által fejlesztett, a [[Warcprox]]-hoz kapcsolódó, Pythonban írt [[crawler]], ami a Chrome böngészőt használja [[headless browser]] módban (valamint a youtube-dl nevű Youtube videó-letöltőt is) weboldalak begyűjtésére és a bennük levő linkek kinyerésére, így jobban boldogul a [[RIA]] típusú site-okkal, mint a [[Heritrix]]-féle hagyományos aratógépek. Az [[Archive-It]] szolgáltatás és nemzeti könyvtárak is kísérleteznek vele.&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
&lt;br /&gt;
* [https://github.com/internetarchive/brozzler A Brozzler a GitHub-on]&lt;br /&gt;
* [https://github.com/internetarchive/brozzler/blob/master/job-conf.rst Brozzler Job Configuration]&lt;br /&gt;
* [http://web.archive.org/web/20170317132129/http://www.netpreserve.org/sites/default/files/GA07-HEKLA-Jefferson_Bailey_1.pdf Jefferson Bailey - Noah Levitt: BROZZLER!]&lt;br /&gt;
* [http://archive.org/~nlevitt/reveal.js Noah Levitt: brozzler]&lt;br /&gt;
* [https://support.archive-it.org/hc/en-us/articles/360000343186-What-is-Brozzler- What is Brozzler?] &lt;br /&gt;
* [https://support.archive-it.org/hc/en-us/articles/360000351986-How-and-when-to-use-Brozzler How and When to Use Brozzler?]&lt;br /&gt;
[[Category:SZOFTVEREK]]&lt;/div&gt;</summary>
		<author><name>Gyula</name></author>
		
	</entry>
	<entry>
		<id>https://webarchivum.oszk.hu/mediawiki/index.php?title=Brozzler&amp;diff=2019</id>
		<title>Brozzler</title>
		<link rel="alternate" type="text/html" href="https://webarchivum.oszk.hu/mediawiki/index.php?title=Brozzler&amp;diff=2019"/>
		<updated>2025-04-29T14:13:10Z</updated>

		<summary type="html">&lt;p&gt;Gyula: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= (browser | crawler &amp;lt;nowiki&amp;gt;=&amp;lt;/nowiki&amp;gt; brozzler) =&lt;br /&gt;
&lt;br /&gt;
Az Internet Archive által fejlesztett, a [[Warcprox]]-hoz kapcsolódó, Pythonban írt [[crawler]], ami a Chrome böngészőt használja [[headless browser]] módban (valamint a youtube-dl nevű Youtube videó-letöltőt is) weboldalak begyűjtésére és a bennük levő linkek kinyerésére, így jobban boldogul a [[RIA]] típusú site-okkal, mint a [[Heritrix]]-féle hagyományos aratógépek. Az [[Archive-It]] szolgáltatás és nemzeti könyvtárak is kísérleteznek vele.&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
&lt;br /&gt;
* [https://github.com/internetarchive/brozzler A Brozzler a GitHub-on]&lt;br /&gt;
* [https://github.com/internetarchive/brozzler/blob/master/job-conf.rst Brozzler Job Configuration]&lt;br /&gt;
* [http://web.archive.org/web/20170317132129/http://www.netpreserve.org/sites/default/files/GA07-HEKLA-Jefferson_Bailey_1.pdf Jefferson Bailey - Noah Levitt: BROZZLER!]&lt;br /&gt;
* [http://archive.org/~nlevitt/reveal.js Noah Levitt: brozzler]&lt;br /&gt;
* [https://support.archive-it.org/hc/en-us/articles/360000343186-What-is-Brozzler- What is Brozzler?] &lt;br /&gt;
&lt;br /&gt;
[[Category:SZOFTVEREK]]&lt;/div&gt;</summary>
		<author><name>Gyula</name></author>
		
	</entry>
	<entry>
		<id>https://webarchivum.oszk.hu/mediawiki/index.php?title=Screaming_Frog_SEO_Spider&amp;diff=2018</id>
		<title>Screaming Frog SEO Spider</title>
		<link rel="alternate" type="text/html" href="https://webarchivum.oszk.hu/mediawiki/index.php?title=Screaming_Frog_SEO_Spider&amp;diff=2018"/>
		<updated>2024-12-21T07:53:23Z</updated>

		<summary type="html">&lt;p&gt;Gyula: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Brit cég által Javában fejlesztett, Windows, MacOS és Ubuntu Linux alatt futtatható program annak felmérésére, hogy egy webhely mennyire &amp;quot;keresőbarát&amp;quot;. Mivel a robotja rengeteg adatot összeszed a megadott URL címen levő oldalakról, melyek táblázatos és grafikus formában is megjeleníthetők, ezért archiválandó site-ok szerkezetének előzetes felmérésére, illetve webhelyek metaadatainak tömeges begyűjtésére is jól használható. Az ingyenes verzióban egyszerre max. 500 URL adható meg és sok funkció ki van kapcsolva. &lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
&lt;br /&gt;
* [https://www.screamingfrog.co.uk/seo-spider/ A Screaming Frog SEO Spider weboldala]&lt;br /&gt;
&lt;br /&gt;
[[Category:SZOFTVEREK]]&lt;/div&gt;</summary>
		<author><name>Gyula</name></author>
		
	</entry>
	<entry>
		<id>https://webarchivum.oszk.hu/mediawiki/index.php?title=Internet_Archive&amp;diff=1919</id>
		<title>Internet Archive</title>
		<link rel="alternate" type="text/html" href="https://webarchivum.oszk.hu/mediawiki/index.php?title=Internet_Archive&amp;diff=1919"/>
		<updated>2024-08-14T10:41:39Z</updated>

		<summary type="html">&lt;p&gt;Gyula: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;1996-ban San Franciscóban Brewster Kahle által alapított nonprofit szervezet és archívum. A főként az [[Alexa Internet]] cég által gyűjtött tartalomból álló világméretű webarchívuma (ami a [[Wayback Machine]] felületen böngészhető) mellett szövegesdokumentum- (főként digitalizáltkönyv- és periodika-), kép-, hang-, videó- és szoftverarchívuma is van (ezeket részben nagy partnerektől kapják, részben a felhasználók töltik fel). Az [[Archive-It]] nevű szolgáltatásán keresztül megbízásra is végeznek webarchiválást több mint 450 könyvtár és egyéb intézmény számára, továbbá néhány nemzeti könyvtárnak domainszintű aratásokat is csinálnak.&amp;lt;br/&amp;gt;&lt;br /&gt;
Az archívum mérete 2024 augusztusában 145 petabájt, amely az alábbiakat foglalja magában:&lt;br /&gt;
&lt;br /&gt;
* 835 milliárd webhely&lt;br /&gt;
* 44 millió könyv és egyéb szöveg&lt;br /&gt;
* 15 millió hangfelvétel (255 ezer teljes koncertfelvétellel)&lt;br /&gt;
* 10,6 millió videó (2,6 millió televíziós híradással)&lt;br /&gt;
* 4,8 millió kép&lt;br /&gt;
* 1 millió szoftver/program&lt;br /&gt;
&lt;br /&gt;
== Történeti adatok ==&lt;br /&gt;
&lt;br /&gt;
* A webarchívum mérete 2017 júniusában 284 milliárd weboldal és heti 1 milliárddal gyarapodik.&lt;br /&gt;
* 2016 októberi adatok: 361 millió webhely, 273 milliárd weboldal, 510 milliárd digitális objektum, kb. 15 petabájt.) A teljes gyűjtemény (vagyis az összes médiatípus) tárhelyigénye 2017 közepén 32 petabájt (mindent legalább két példányban tárolnak).&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
&lt;br /&gt;
* [http://archive.org Internet Archive honlap]&lt;br /&gt;
* [http://blog.archive.org Internet Archive blog]&lt;br /&gt;
* [http://webservices.archive.org Internet Archive Web Archiving Services]&lt;br /&gt;
* [https://hu.wikipedia.org/wiki/Internet_Archive Wikipédia: Internet Archive]&lt;br /&gt;
* [https://en.wikipedia.org/wiki/Internet_Archive Wikipedia: Internet Archive]&lt;br /&gt;
&lt;br /&gt;
[[Category:PROJEKTEK]]&lt;/div&gt;</summary>
		<author><name>Gyula</name></author>
		
	</entry>
	<entry>
		<id>https://webarchivum.oszk.hu/mediawiki/index.php?title=Internet_Archive&amp;diff=1918</id>
		<title>Internet Archive</title>
		<link rel="alternate" type="text/html" href="https://webarchivum.oszk.hu/mediawiki/index.php?title=Internet_Archive&amp;diff=1918"/>
		<updated>2024-08-14T10:40:45Z</updated>

		<summary type="html">&lt;p&gt;Gyula: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;1996-ban San Franciscóban Brewster Kahle által alapított nonprofit szervezet és archívum. A főként az [[Alexa Internet]] cég által gyűjtött tartalomból álló világméretű webarchívuma (ami a [[Wayback Machine]] felületen böngészhető) mellett szövegesdokumentum- (főként digitalizáltkönyv- és periodika-), kép-, hang-, videó- és szoftverarchívuma is van (ezeket részben nagy partnerektől kapják, részben a felhasználók töltik fel).&amp;lt;br/&amp;gt;&lt;br /&gt;
Az archívum mérete 2024 augusztusában 145 petabájt, amely az alábbiakat foglalja magában:&lt;br /&gt;
&lt;br /&gt;
* 835 milliárd webhely&lt;br /&gt;
* 44 millió könyv és egyéb szöveg&lt;br /&gt;
* 15 millió hangfelvétel (255 ezer teljes koncertfelvétellel)&lt;br /&gt;
* 10,6 millió videó (2,6 millió televíziós híradással)&lt;br /&gt;
* 4,8 millió kép&lt;br /&gt;
* 1 millió szoftver/program&lt;br /&gt;
&lt;br /&gt;
== Történeti adatok ==&lt;br /&gt;
&lt;br /&gt;
* A webarchívum mérete 2017 júniusában 284 milliárd weboldal és heti 1 milliárddal gyarapodik.&lt;br /&gt;
* 2016 októberi adatok: 361 millió webhely, 273 milliárd weboldal, 510 milliárd digitális objektum, kb. 15 petabájt.) A teljes gyűjtemény (vagyis az összes médiatípus) tárhelyigénye 2017 közepén 32 petabájt (mindent legalább két példányban tárolnak). Az [[Archive-It]] nevű szolgáltatásán keresztül megbízásra is végeznek webarchiválást több mint 450 könyvtár és egyéb intézmény számára, továbbá néhány nemzeti könyvtárnak domainszintű aratásokat is csinálnak.&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
&lt;br /&gt;
* [http://archive.org Internet Archive honlap]&lt;br /&gt;
* [http://blog.archive.org Internet Archive blog]&lt;br /&gt;
* [http://webservices.archive.org Internet Archive Web Archiving Services]&lt;br /&gt;
* [https://hu.wikipedia.org/wiki/Internet_Archive Wikipédia: Internet Archive]&lt;br /&gt;
* [https://en.wikipedia.org/wiki/Internet_Archive Wikipedia: Internet Archive]&lt;br /&gt;
&lt;br /&gt;
[[Category:PROJEKTEK]]&lt;/div&gt;</summary>
		<author><name>Gyula</name></author>
		
	</entry>
	<entry>
		<id>https://webarchivum.oszk.hu/mediawiki/index.php?title=Internet_Archive&amp;diff=1917</id>
		<title>Internet Archive</title>
		<link rel="alternate" type="text/html" href="https://webarchivum.oszk.hu/mediawiki/index.php?title=Internet_Archive&amp;diff=1917"/>
		<updated>2024-08-14T10:40:10Z</updated>

		<summary type="html">&lt;p&gt;Gyula: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;1996-ban San Franciscóban Brewster Kahle által alapított nonprofit szervezet és archívum. A főként az [[Alexa Internet]] cég által gyűjtött tartalomból álló világméretű webarchívuma (ami a [[Wayback Machine]] felületen böngészhető) mellett szövegesdokumentum- (főként digitalizáltkönyv- és periodika-), kép-, hang-, videó- és szoftverarchívuma is van (ezeket részben nagy partnerektől kapják, részben a felhasználók töltik fel).&lt;br /&gt;
Az archívum mérete 2024 augusztusában 145 petabájt, amely az alábbiakat foglalja magában:&lt;br /&gt;
&lt;br /&gt;
* 835 milliárd webhely&lt;br /&gt;
* 44 millió könyv és egyéb szöveg&lt;br /&gt;
* 15 millió hangfelvétel (255 ezer teljes koncertfelvétellel)&lt;br /&gt;
* 10,6 millió videó (2,6 millió televíziós híradással)&lt;br /&gt;
* 4,8 millió kép&lt;br /&gt;
* 1 millió szoftver/program&lt;br /&gt;
&lt;br /&gt;
## Történeti adatok&lt;br /&gt;
* A webarchívum mérete 2017 júniusában 284 milliárd weboldal és heti 1 milliárddal gyarapodik.&lt;br /&gt;
* 2016 októberi adatok: 361 millió webhely, 273 milliárd weboldal, 510 milliárd digitális objektum, kb. 15 petabájt.) A teljes gyűjtemény (vagyis az összes médiatípus) tárhelyigénye 2017 közepén 32 petabájt (mindent legalább két példányban tárolnak). Az [[Archive-It]] nevű szolgáltatásán keresztül megbízásra is végeznek webarchiválást több mint 450 könyvtár és egyéb intézmény számára, továbbá néhány nemzeti könyvtárnak domainszintű aratásokat is csinálnak.&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
&lt;br /&gt;
* [http://archive.org Internet Archive honlap]&lt;br /&gt;
* [http://blog.archive.org Internet Archive blog]&lt;br /&gt;
* [http://webservices.archive.org Internet Archive Web Archiving Services]&lt;br /&gt;
* [https://hu.wikipedia.org/wiki/Internet_Archive Wikipédia: Internet Archive]&lt;br /&gt;
* [https://en.wikipedia.org/wiki/Internet_Archive Wikipedia: Internet Archive]&lt;br /&gt;
&lt;br /&gt;
[[Category:PROJEKTEK]]&lt;/div&gt;</summary>
		<author><name>Gyula</name></author>
		
	</entry>
	<entry>
		<id>https://webarchivum.oszk.hu/mediawiki/index.php?title=Internet_Archive&amp;diff=1916</id>
		<title>Internet Archive</title>
		<link rel="alternate" type="text/html" href="https://webarchivum.oszk.hu/mediawiki/index.php?title=Internet_Archive&amp;diff=1916"/>
		<updated>2024-08-14T10:34:50Z</updated>

		<summary type="html">&lt;p&gt;Gyula: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;1996-ban San Franciscóban Brewster Kahle által alapított nonprofit szervezet és archívum. A főként az [[Alexa Internet]] cég által gyűjtött tartalomból álló világméretű webarchívuma (ami a [[Wayback Machine]] felületen böngészhető) mellett szövegesdokumentum- (főként digitalizáltkönyv- és periodika-), kép-, hang-, videó- és szoftverarchívuma is van (ezeket részben nagy partnerektől kapják, részben a felhasználók töltik fel). A webarchívum mérete 2017 júniusában 284 milliárd weboldal és heti 1 milliárddal gyarapodik. (2016 októberi adatok: 361 millió webhely, 273 milliárd weboldal, 510 milliárd digitális objektum, kb. 15 petabájt.) A teljes gyűjtemény (vagyis az összes médiatípus) tárhelyigénye 2017 közepén 32 petabájt (mindent legalább két példányban tárolnak). Az [[Archive-It]] nevű szolgáltatásán keresztül megbízásra is végeznek webarchiválást több mint 450 könyvtár és egyéb intézmény számára, továbbá néhány nemzeti könyvtárnak domainszintű aratásokat is csinálnak.&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
&lt;br /&gt;
* [http://archive.org Internet Archive honlap]&lt;br /&gt;
* [http://blog.archive.org Internet Archive blog]&lt;br /&gt;
* [http://webservices.archive.org Internet Archive Web Archiving Services]&lt;br /&gt;
* [https://hu.wikipedia.org/wiki/Internet_Archive Wikipédia: Internet Archive]&lt;br /&gt;
* [https://en.wikipedia.org/wiki/Internet_Archive Wikipedia: Internet Archive]&lt;br /&gt;
&lt;br /&gt;
[[Category:PROJEKTEK]]&lt;/div&gt;</summary>
		<author><name>Gyula</name></author>
		
	</entry>
	<entry>
		<id>https://webarchivum.oszk.hu/mediawiki/index.php?title=Apify&amp;diff=1915</id>
		<title>Apify</title>
		<link rel="alternate" type="text/html" href="https://webarchivum.oszk.hu/mediawiki/index.php?title=Apify&amp;diff=1915"/>
		<updated>2024-08-14T10:26:37Z</updated>

		<summary type="html">&lt;p&gt;Gyula: /* (korábban: Apifier) */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= (korábban: Apifier) =&lt;br /&gt;
&lt;br /&gt;
Prágai cég által fejlesztett szoftvercsomag, valamint fizetős felhőszolgáltatás különféle webes feladatok automatizálására: például űrlapok kitöltésére, fájlok feltöltésére, webes szolgáltatások API-kon keresztül való összekapcsolására, adatfeldolgozásra. Tartozik hozzá egy Chrome-alapú [[crawler]] és olyan [[web scraping]] eszközökkel is bővíthető, melyeket egy programozó közösség készít. Már rengeteg API-hoz van ilyen ''actor'' modul (pl. Google, Google Maps, Instagram, Facebook, YouTube, Twitter). A kitiltások ellen egy HTTP proxy véd, amivel elrejthetők a robotokat futtató IP címek, az adatok tárolására pedig felhőtárhelyet biztosítanak. A cég egy open source, Node.js-alapú rendszerfejlesztői könyvtárat is gondoz a különböző web scraping és böngészőautomatizálási feladatokhoz.&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
&lt;br /&gt;
* [https://apify.com/ Az Apify honlapja]&lt;br /&gt;
* [https://github.com/apify Az Apify a GitHub-on]&lt;br /&gt;
&lt;br /&gt;
[[Category:SZOLGÁLTATÁSOK]]&lt;br /&gt;
[[Category:SZOFTVEREK]]&lt;/div&gt;</summary>
		<author><name>Gyula</name></author>
		
	</entry>
	<entry>
		<id>https://webarchivum.oszk.hu/mediawiki/index.php?title=MIA_WIKI&amp;diff=1803</id>
		<title>MIA WIKI</title>
		<link rel="alternate" type="text/html" href="https://webarchivum.oszk.hu/mediawiki/index.php?title=MIA_WIKI&amp;diff=1803"/>
		<updated>2023-10-19T06:11:34Z</updated>

		<summary type="html">&lt;p&gt;Gyula: szervezeti információ frissítése&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;== ''A Magyar Internet Archívumhoz készülő tudásbázis '' ==&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
&lt;br /&gt;
{|style=&amp;quot;width: 55%; margin: auto;&amp;quot;&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; style=&amp;quot;text-align:left; padding-left: 17pt;&amp;quot; | A JELENLEGI [[:Category:MIA WIKI KATEGÓRIÁK|KATEGÓRIÁK]] ÉS SZÓCIKKEIK SZÁMA:&lt;br /&gt;
|-&lt;br /&gt;
|&lt;br /&gt;
* [[:Category:FOGALMAK|FOGALMAK]] / {{PAGESINCATEGORY:FOGALMAK}}&lt;br /&gt;
* [[:Category:FORMÁTUMOK|FORMÁTUMOK]] / {{PAGESINCATEGORY:FORMÁTUMOK}}&lt;br /&gt;
* [[:Category:FÓRUMOK|FÓRUMOK]] / {{PAGESINCATEGORY:FÓRUMOK}}&lt;br /&gt;
* [[:Category:HASZNOSÍTÁS|HASZNOSÍTÁS]] / {{PAGESINCATEGORY:HASZNOSÍTÁS}}&lt;br /&gt;
* [[:Category:IRODALOM|IRODALOM]] / {{PAGESINCATEGORY:IRODALOM}}&lt;br /&gt;
* [[:Category:PROJEKTEK|PROJEKTEK]] / {{PAGESINCATEGORY:PROJEKTEK}}&lt;br /&gt;
|&lt;br /&gt;
* [[:Category:RENDEZVÉNYEK|RENDEZVÉNYEK]] / {{PAGESINCATEGORY:RENDEZVÉNYEK}}&lt;br /&gt;
* [[:Category:SZABVÁNYOK|SZABVÁNYOK]] / {{PAGESINCATEGORY:SZABVÁNYOK}}&lt;br /&gt;
* [[:Category:SZERVEZETEK|SZERVEZETEK]] / {{PAGESINCATEGORY:SZERVEZETEK}}&lt;br /&gt;
* [[:Category:SZOFTVEREK|SZOFTVEREK]] / {{PAGESINCATEGORY:SZOFTVEREK}}&lt;br /&gt;
* [[:Category:SZOLGÁLTATÁSOK|SZOLGÁLTATÁSOK]] / {{PAGESINCATEGORY:SZOLGÁLTATÁSOK}}&lt;br /&gt;
* [[Speciális:Az_összes_lap_listája|''Az összes szócikk listája'']]&lt;br /&gt;
|}&lt;br /&gt;
[[Fájl:3D_wall.png|center]]&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot; style=&amp;quot;margin-left: auto; margin-right: 0px;&amp;quot;&lt;br /&gt;
| Szerkesztők: Drótos László - Kalcsó Gyula &amp;lt;br /&amp;gt;[http://www.oszk.hu OSZK] - [https://webarchivum.oszk.hu/a-projektrol/munkatarsak-es-segitok/ Digitális Filológiai és Webarchiválási Osztály]&amp;lt;br /&amp;gt;Információs e-mail cím: [mailto:webarchivum@oszk.hu webarchivum@oszk.hu]&amp;lt;br /&amp;gt;Projekt honlap: https://webarchivum.oszk.hu&amp;lt;br /&amp;gt;Creative Commons licenc: [https://creativecommons.org/licenses/by-nc-sa/2.5/hu/ by-nc-sa/2.5] &lt;br /&gt;
|}&lt;/div&gt;</summary>
		<author><name>Gyula</name></author>
		
	</entry>
	<entry>
		<id>https://webarchivum.oszk.hu/mediawiki/index.php?title=StormCrawler&amp;diff=1802</id>
		<title>StormCrawler</title>
		<link rel="alternate" type="text/html" href="https://webarchivum.oszk.hu/mediawiki/index.php?title=StormCrawler&amp;diff=1802"/>
		<updated>2023-10-02T08:25:46Z</updated>

		<summary type="html">&lt;p&gt;Gyula: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;A brit [[DigitalPebble]] cég által támogatott, 2014 óta fejlesztett, nagyrészt Java nyelvű open source programkönyvtár és eszközkészlet alacsony késleltetésű, rugalmas, jól skálázható, könnyen bővíthető, udvarias, de hatékony [[crawler]]-ek készítéséhez, melyek az Elasticsearch rendszert és az adatfolyamokat valós időben feldolgozó Apache Storm technológiát használják (ezért az Apache Mavent is telepíteni kell hozzá).&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
&lt;br /&gt;
* [http://stormcrawler.net/ A StormCrawler honlapja]&lt;br /&gt;
* [https://github.com/DigitalPebble/storm-crawler StormCrawler a GitHub-on]&lt;br /&gt;
&lt;br /&gt;
[[Category:SZOFTVEREK]]&lt;/div&gt;</summary>
		<author><name>Gyula</name></author>
		
	</entry>
	<entry>
		<id>https://webarchivum.oszk.hu/mediawiki/index.php?title=Crawler&amp;diff=1801</id>
		<title>Crawler</title>
		<link rel="alternate" type="text/html" href="https://webarchivum.oszk.hu/mediawiki/index.php?title=Crawler&amp;diff=1801"/>
		<updated>2023-09-04T12:13:49Z</updated>

		<summary type="html">&lt;p&gt;Gyula: /* (spider, web robot, bot, harvester) */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= (spider, web robot, bot, harvester) =&lt;br /&gt;
&lt;br /&gt;
A keresőgépek számára vagy archiválási célra a weboldalakat linkek mentén bejáró és többnyire tartalmukat is lementő szoftverek gyűjtőneve. A crawler egy előre megadott URL címlistából (seeds) indul ki, majd követi az ezeken a weboldalakon talált linkeket is. A viselkedése részletesen konfigurálható, például ilyen paraméterekkel:&lt;br /&gt;
* Milyen mélységig kövesse a linkeket egy webhelyen belül?&lt;br /&gt;
* Kövesse-e a más site-okra mutató linkeket és ha igen, akkor meddig?&lt;br /&gt;
* Milyen fájltípusokat és milyen mérethatárig mentsen le? hány szálon induljon el párhuzamosan?&lt;br /&gt;
* Milyen gyakorisággal térjen vissza ugyanarra a webhelyre?&lt;br /&gt;
* Figyelembe vegye-e a [[robots txt|robots.txt]]-ben megadott tiltásokat?&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
&lt;br /&gt;
* [https://hu.wikipedia.org/wiki/Keres%C5%91robot Wikipédia: Keresőrobot]&lt;br /&gt;
* [https://en.wikipedia.org/wiki/Web_crawler Wikipedia: Web crawler]&lt;br /&gt;
&lt;br /&gt;
[[Category:FOGALMAK]]&lt;/div&gt;</summary>
		<author><name>Gyula</name></author>
		
	</entry>
	<entry>
		<id>https://webarchivum.oszk.hu/mediawiki/index.php?title=Crawler&amp;diff=1800</id>
		<title>Crawler</title>
		<link rel="alternate" type="text/html" href="https://webarchivum.oszk.hu/mediawiki/index.php?title=Crawler&amp;diff=1800"/>
		<updated>2023-09-04T12:13:25Z</updated>

		<summary type="html">&lt;p&gt;Gyula: /* (spider, web robot, bot, harvester) */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= (spider, web robot, bot, harvester) =&lt;br /&gt;
&lt;br /&gt;
A keresőgépek számára vagy archiválási célra a weboldalakat linkek mentén bejáró és többnyire tartalmukat is lementő szoftverek gyűjtőneve. A crawler egy előre megadott URL címlistából (seeds) indul ki, majd követi az ezeken a weboldalakon talált linkeket is. A viselkedése részletesen konfigurálható, például ilyen paraméterekkel:&lt;br /&gt;
* milyen mélységig kövesse a linkeket egy webhelyen belül?&lt;br /&gt;
* kövesse-e a más site-okra mutató linkeket és ha igen, akkor meddig?&lt;br /&gt;
* milyen fájltípusokat és milyen mérethatárig mentsen le? hány szálon induljon el párhuzamosan?&lt;br /&gt;
* milyen gyakorisággal térjen vissza ugyanarra a webhelyre?&lt;br /&gt;
* figyelembe vegye-e a [[robots txt|robots.txt]]-ben megadott tiltásokat?&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
&lt;br /&gt;
* [https://hu.wikipedia.org/wiki/Keres%C5%91robot Wikipédia: Keresőrobot]&lt;br /&gt;
* [https://en.wikipedia.org/wiki/Web_crawler Wikipedia: Web crawler]&lt;br /&gt;
&lt;br /&gt;
[[Category:FOGALMAK]]&lt;/div&gt;</summary>
		<author><name>Gyula</name></author>
		
	</entry>
	<entry>
		<id>https://webarchivum.oszk.hu/mediawiki/index.php?title=Crawler&amp;diff=1799</id>
		<title>Crawler</title>
		<link rel="alternate" type="text/html" href="https://webarchivum.oszk.hu/mediawiki/index.php?title=Crawler&amp;diff=1799"/>
		<updated>2023-09-04T12:12:12Z</updated>

		<summary type="html">&lt;p&gt;Gyula: /* (spider, web robot, bot, harvester) */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= (spider, web robot, bot, harvester) =&lt;br /&gt;
&lt;br /&gt;
A keresőgépek számára vagy archiválási célra a weboldalakat linkek mentén bejáró és többnyire tartalmukat is lementő szoftverek gyűjtőneve. A crawler egy előre megadott URL címlistából (seeds) indul ki, majd követi az ezeken a weboldalakon talált linkeket is. A viselkedése részletesen konfigurálható, például ilyen paraméterekkel:  milyen mélységig kövesse a linkeket egy webhelyen belül? kövesse-e a más site-okra mutató linkeket és ha igen, akkor meddig? milyen fájltípusokat és milyen mérethatárig mentsen le? hány szálon induljon el párhuzamosan? milyen gyakorisággal térjen vissza ugyanarra a webhelyre? figyelembe vegye-e a [[robots txt|robots.txt]]-ben megadott tiltásokat?&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
&lt;br /&gt;
* [https://hu.wikipedia.org/wiki/Keres%C5%91robot Wikipédia: Keresőrobot]&lt;br /&gt;
* [https://en.wikipedia.org/wiki/Web_crawler Wikipedia: Web crawler]&lt;br /&gt;
&lt;br /&gt;
[[Category:FOGALMAK]]&lt;/div&gt;</summary>
		<author><name>Gyula</name></author>
		
	</entry>
	<entry>
		<id>https://webarchivum.oszk.hu/mediawiki/index.php?title=Webarchief_KB_(holland)&amp;diff=1722</id>
		<title>Webarchief KB (holland)</title>
		<link rel="alternate" type="text/html" href="https://webarchivum.oszk.hu/mediawiki/index.php?title=Webarchief_KB_(holland)&amp;diff=1722"/>
		<updated>2023-03-05T19:06:52Z</updated>

		<summary type="html">&lt;p&gt;Gyula: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;A holland nemzeti könyvtár, a Koninklijke Bibliotheek 2007 szeptemberétől működő szelektív webarchívuma. Elsősorban a tudományos és kulturális, továbbá az innovatív webhelyekre koncentrálnak a válogatáskor (mert a politikai ill. az audiovizuális tartalmakat más holland webarchívumok mentik), és engedélyt kérnek a robottal való bejáráshoz, a lementéshez és a szolgáltatáshoz. A tartalomgazdának 4 hete van egy [[opt-out]] nyilatkozat visszaküldésével megtagadni ezt. A felhasználók is javasolhatnak megőrzésre érdemes honlapot. Egy webhelyet évente egyszer-kétszer archiválnak, de a főbb hírportálokat naponta, viszont csak hónapok múlva válik a mentés visszakereshetővé. A [[Heritrix]] és [[Wayback]] párost használják, de még fejlesztik a rendszert. A [[Heritrix]] részben [[polite crawler]] módban dolgozik: ötször annyi ideig vár a következő kéréssel, mint amennyire az előző kérés teljesítéséhez szüksége volt a webszervernek, de a [[robots txt|robots.txt]]-t figyelmen kívül hagyják (hacsak a site gazdája külön nem kifogásolja), mert a tapasztalatok szerint sokszor nem szándékosan vannak kitiltva a robotok, csak mert ez a webszerver vagy a CMS rendszer alapbeállítása.&lt;br /&gt;
&lt;br /&gt;
Az .nl top domain teljes aratásával nem próbálkoznak, túl nagy a feladat (5.74 millió regisztrált domain) és inkább kevés, de teljes értékű mentést akarnak, sok töredékes helyett. 2017 elején 12 ezer webhelyről 25 terabájt adatot tároltak (ezek negyede már időközben eltűnt az [[live web|élő web]]ről). Hozzáférés (2011 óta) csak helyben lehetséges, jogi okok miatt (nincs még kötelespéldány szabály a webes tartalmakra), de saját célra lehet másolatot készíteni.&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
&lt;br /&gt;
* [https://www.kb.nl/en/about-us/expertise/web-archiving A webarchiválás angol nyelvű ismertetője a könyvtár honlapján]&lt;br /&gt;
&lt;br /&gt;
[[Category:PROJEKTEK]]&lt;br /&gt;
[[Category:NEMZETI PROJEKTEK]]&lt;/div&gt;</summary>
		<author><name>Gyula</name></author>
		
	</entry>
	<entry>
		<id>https://webarchivum.oszk.hu/mediawiki/index.php?title=Webarchief_KB_(holland)&amp;diff=1721</id>
		<title>Webarchief KB (holland)</title>
		<link rel="alternate" type="text/html" href="https://webarchivum.oszk.hu/mediawiki/index.php?title=Webarchief_KB_(holland)&amp;diff=1721"/>
		<updated>2023-03-05T19:06:42Z</updated>

		<summary type="html">&lt;p&gt;Gyula: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;A holland nemzeti könyvtár, a Koninklijke Bibliotheek 2007 szeptemberétől működő szelektív webarchívuma. Elsősorban a tudományos és kulturális, továbbá az innovatív webhelyekre koncentrálnak a válogatáskor (mert a politikai ill. az audiovizuális tartalmakat más holland webarchívumok mentik), és engedélyt kérnek a robottal való bejáráshoz, a lementéshez és a szolgáltatáshoz. A tartalomgazdának 4 hete van egy [[opt-out]] nyilatkozat visszaküldésével megtagadni ezt. A felhasználók is javasolhatnak megőrzésre érdemes honlapot. Egy webhelyet évente egyszer-kétszer archiválnak, de a főbb hírportálokat naponta, viszont csak hónapok múlva válik a mentés visszakereshetővé. A [[Heritrix]] és [[Wayback]] párost használják, de még fejlesztik a rendszert. A [[Heritrix]] részben [[polite crawler]] módban dolgozik: ötször annyi ideig vár a következő kéréssel, mint amennyire az előző kérés teljesítéséhez szüksége volt a webszervernek, de a [[robots txt|robots.txt]]-t figyelmen kívül hagyják (hacsak a site gazdája külön nem kifogásolja), mert a tapasztalatok szerint sokszor nem szándékosan vannak kitiltva a robotok, csak mert ez a webszerver vagy a CMS rendszer alapbeállítása.&lt;br /&gt;
&lt;br /&gt;
Az .nl top domain teljes aratásával nem próbálkoznak, túl nagy a feladat (5.74 millió regisztrált domain) és inkább kevés, de teljes értékű mentést akarnak, sok töredékes helyett. 2017 elején 12 ezer webhelyről 25 terabájt adatot tároltak (ezek negyede már időközben eltűnt az [[live web|élő web]]ről). Hozzáférés (2011 óta) csak helyben lehetséges, jogi okok miatt (nincs még kötelespéldány szabály a webes tartalmakra), de saját célra lehet másolatot készíteni.&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
&lt;br /&gt;
* [ A Webarchief KB honlapja]&lt;br /&gt;
* [https://www.kb.nl/en/about-us/expertise/web-archiving A webarchiválás angol nyelvű ismertetője a könyvtár honlapján]&lt;br /&gt;
&lt;br /&gt;
[[Category:PROJEKTEK]]&lt;br /&gt;
[[Category:NEMZETI PROJEKTEK]]&lt;/div&gt;</summary>
		<author><name>Gyula</name></author>
		
	</entry>
	<entry>
		<id>https://webarchivum.oszk.hu/mediawiki/index.php?title=Webarchief_KB_(holland)&amp;diff=1720</id>
		<title>Webarchief KB (holland)</title>
		<link rel="alternate" type="text/html" href="https://webarchivum.oszk.hu/mediawiki/index.php?title=Webarchief_KB_(holland)&amp;diff=1720"/>
		<updated>2023-03-05T19:06:33Z</updated>

		<summary type="html">&lt;p&gt;Gyula: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;A holland nemzeti könyvtár, a Koninklijke Bibliotheek 2007 szeptemberétől működő szelektív webarchívuma. Elsősorban a tudományos és kulturális, továbbá az innovatív webhelyekre koncentrálnak a válogatáskor (mert a politikai ill. az audiovizuális tartalmakat más holland webarchívumok mentik), és engedélyt kérnek a robottal való bejáráshoz, a lementéshez és a szolgáltatáshoz. A tartalomgazdának 4 hete van egy [[opt-out]] nyilatkozat visszaküldésével megtagadni ezt. A felhasználók is javasolhatnak megőrzésre érdemes honlapot. Egy webhelyet évente egyszer-kétszer archiválnak, de a főbb hírportálokat naponta, viszont csak hónapok múlva válik a mentés visszakereshetővé. A [[Heritrix]] és [[Wayback]] párost használják, de még fejlesztik a rendszert. A [[Heritrix]] részben [[polite crawler]] módban dolgozik: ötször annyi ideig vár a következő kéréssel, mint amennyire az előző kérés teljesítéséhez szüksége volt a webszervernek, de a [[robots txt|robots.txt]]-t figyelmen kívül hagyják (hacsak a site gazdája külön nem kifogásolja), mert a tapasztalatok szerint sokszor nem szándékosan vannak kitiltva a robotok, csak mert ez a webszerver vagy a CMS rendszer alapbeállítása.&lt;br /&gt;
&lt;br /&gt;
Az .nl top domain teljes aratásával nem próbálkoznak, túl nagy a feladat (5.74 millió regisztrált domain) és inkább kevés, de teljes értékű mentést akarnak, sok töredékes helyett. 2017 elején 12 ezer webhelyről 25 terabájt adatot tároltak (ezek negyede már időközben eltűnt az [[live web|élő web]]ről). Hozzáférés (2011 óta) csak helyben lehetséges, jogi okok miatt (nincs még kötelespéldány szabály a webes tartalmakra), de saját célra lehet másolatot készíteni.&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
&lt;br /&gt;
* [webaccess.kb.nl:8080/archived/ A Webarchief KB honlapja]&lt;br /&gt;
* [https://www.kb.nl/en/about-us/expertise/web-archiving A webarchiválás angol nyelvű ismertetője a könyvtár honlapján]&lt;br /&gt;
&lt;br /&gt;
[[Category:PROJEKTEK]]&lt;br /&gt;
[[Category:NEMZETI PROJEKTEK]]&lt;/div&gt;</summary>
		<author><name>Gyula</name></author>
		
	</entry>
	<entry>
		<id>https://webarchivum.oszk.hu/mediawiki/index.php?title=Arch%C3%ADvumt%C3%ADpusok&amp;diff=1707</id>
		<title>Archívumtípusok</title>
		<link rel="alternate" type="text/html" href="https://webarchivum.oszk.hu/mediawiki/index.php?title=Arch%C3%ADvumt%C3%ADpusok&amp;diff=1707"/>
		<updated>2023-03-01T12:36:14Z</updated>

		<summary type="html">&lt;p&gt;Gyula: /* Az archiváló szerint */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Az interneten található tartalom megőrzésének többféle módszere alakult ki, és előfordul, hogy ezek egy archívumon belül is keverednek, részhalmazokat alkotva a teljes gyűjteményen belül. A típusok csoportosíthatók:&lt;br /&gt;
&lt;br /&gt;
== Gyűjtőkör szerint ==&lt;br /&gt;
&lt;br /&gt;
* '''szelektív''' (valamilyen szempontrendszer szerint válogatott webhelyek, weboldalak, vagy akár egyedi dokumentumok)&lt;br /&gt;
** általános kategóriák (pl. oktatási, tudományos, kormányzati webhelyek)&lt;br /&gt;
** szűkebb témák (pl. adott szakterülethez, földrajzi helyhez, intézményhez, személyhez kötődő tartalmak)&lt;br /&gt;
** események (pl. választások, katasztrófák, háborúk idején minden róluk megjelent tartalom)&lt;br /&gt;
** műfaj (pl. e-folyóiratok, hírportálok, Twitter-üzenetek, Facebook-oldalak, videók)&lt;br /&gt;
* '''teljes körű''' (a lehatárolás csak automatikus módszerekkel történik, azon belül teljességre törekedve)&lt;br /&gt;
** világméretű (minden nyilvánosan elérhető online tartalom)&lt;br /&gt;
** világrész méretű (pl. Ausztrália és Óceánia, Skandinávia)&lt;br /&gt;
** nemzeti szintű (pl. a [[CcTLD|top-level ország-domain]] alatti, vagy az adott ország állampolgárai/intézményei által bejegyzett domain-ek alatti webhelyek, vagy az adott nemzeti nyelven íródott tartalmak, illetve az adott országgal és nemzettel kapcsolatos tartalmak bármely domain alatt)&lt;br /&gt;
** egyéb domainre vagy subdomainre kiterjedő (pl. minden .gov vagy minden ac.uk alatti webhely)&lt;br /&gt;
&lt;br /&gt;
== Az archiváló szerint ==&lt;br /&gt;
&lt;br /&gt;
* '''magánarchívum''' (pl. az illető által létrehozott és/vagy vele kapcsolatos, őt érdeklő online tartalmak lementései)&lt;br /&gt;
* '''céges archívum''' (pl. egy adott vállalat által létrehozott és/vagy vele, illetve a versenytársaival/piacával kapcsolatos online tartalmak lementései)&lt;br /&gt;
* '''intézményi archívum''' (pl. egy könyvtár gyűjtőkörébe tartozó vagy egy kutatóintézet szakterületéhez kapcsolódó webes tartalmak gyűjteménye)&lt;br /&gt;
* '''országos archívum''' (pl. a nemzeti örökség hosszú távú megőrzése céljából a nemzeti könyvtár vagy levéltár vagy valamilyen konzorcium által fenntartott archívum)&lt;br /&gt;
&lt;br /&gt;
== A tárolási mód szerint ==&lt;br /&gt;
&lt;br /&gt;
* '''fájlrendszerbe mentés''' (a weboldalt alkotó fájlok egyenkénti tárolása, az eredeti fájlnevek megőrzésével vagy átnevezésével, és a linkek relatívvá tételével, hogy az archív példány is navigálható maradjon)&lt;br /&gt;
* '''archív állományba mentés''' (a weboldalakat alkotó objektumoknak és azok technikai metaadatainak nagy fájlokba mentése pl. [[WARC]] formátumú csomagokat képezve)&lt;br /&gt;
* '''egységes formátumba mentés''' (a weboldalak tartalmának és/vagy kinézetének megőrzése azok eredeti szerkezetének megtartása nélkül, pl. egységesen XML formátumra konvertálva, vagy [[PDF A|PDF/A]] fájlba &amp;quot;nyomtatva&amp;quot; őket, vagy pl. PNG képeket készítve róluk)&lt;br /&gt;
* '''adatbázisba mentés''' (elsősorban nem webhelyek, hanem pl. elektronikus levelek, tweetek, blogbejegyzések, Facebook-postok, hírportálokról letöltött cikkek stb. adatbázis-rekordokként való tárolása)&lt;br /&gt;
&lt;br /&gt;
== A mentés módja szerint ==&lt;br /&gt;
&lt;br /&gt;
* '''aratással''' (egy [[crawler]] végzi a gyűjtést az eredeti webhelyről vagy a szolgáltató által &amp;quot;crawler-baráttá&amp;quot; tett felületről vagy RSS-feedről – beállított paraméterek szerint követve a linkeket és archív csomagokat képezve)&lt;br /&gt;
* '''letöltőalkalmazással''' (egy weboldalak lementésére készült szoftverrel vagy böngészőkiegészítővel adott weboldal, vagy adott webhely, vagy adott URL címlista lementése, rendszerint fájlrendszerbe)&lt;br /&gt;
* '''push technikával''' (a tartalmat vagy az eredeti szolgáltató szerver küldi be az archívumba, valamilyen szabványos adatcsere protokollon keresztül, pl. rendszeresen tükrözve a teljes site-ot/adatbázist vagy annak XML-be kimentett tartalmát, ill. csak az újdonságokat/változásokat, vagy valamilyen proxy szerver küld be egy másolatot az archívumba minden rajta áthaladó (a felhasználók kliensei által kért) digitális objektumból.&lt;br /&gt;
* '''depozitként''' (az eredeti tartalomgazdák valamilyen offline hordozón adják be alkalmanként a webhelyük tartalmának aktuális másolatát, vagy egy személy/örököse küldi be az online anyagait digitális hagyatékként)&lt;br /&gt;
&lt;br /&gt;
== Gyakoriság és idődimenzió szerint ==&lt;br /&gt;
&lt;br /&gt;
* '''ismétlődő mentések hosszú távú megőrzéssel''' (egy-egy website rendszeres mentése, lehetőleg a webhely változékonyságához optimalizálva, adott időpontbeli állapot visszaállításának lehetőségével, hosszú távra tervezve)&lt;br /&gt;
* '''ismétlődő mentések az utolsó állapotot megőrizve''' (egy-egy website rendszeres mentése, de a korábbi változatok megőrzése nélkül, pl. a keresőrendszerek számára szükséges indexeléshez, vagy pl. egy piaci szegmens aktuális állapotát kutató adatbányászathoz)&lt;br /&gt;
* '''egyedi vagy alkalmi mentések''' (egy-egy webhely, vagy weblap, vagy webkettes tartalom, vagy dokumentum egyszeri vagy alkalomszerű mentése (pl. hogy egy publikációban stabil URI-val lehessen rá hivatkozni, vagy hogy bizonyítékként felhasználható legyen egy jogi eljárásban)&lt;br /&gt;
&lt;br /&gt;
[[Category:FOGALMAK]]&lt;/div&gt;</summary>
		<author><name>Gyula</name></author>
		
	</entry>
	<entry>
		<id>https://webarchivum.oszk.hu/mediawiki/index.php?title=Arch%C3%ADvumt%C3%ADpusok&amp;diff=1706</id>
		<title>Archívumtípusok</title>
		<link rel="alternate" type="text/html" href="https://webarchivum.oszk.hu/mediawiki/index.php?title=Arch%C3%ADvumt%C3%ADpusok&amp;diff=1706"/>
		<updated>2023-03-01T12:35:18Z</updated>

		<summary type="html">&lt;p&gt;Gyula: /* Az archiváló szerint */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Az interneten található tartalom megőrzésének többféle módszere alakult ki, és előfordul, hogy ezek egy archívumon belül is keverednek, részhalmazokat alkotva a teljes gyűjteményen belül. A típusok csoportosíthatók:&lt;br /&gt;
&lt;br /&gt;
== Gyűjtőkör szerint ==&lt;br /&gt;
&lt;br /&gt;
* '''szelektív''' (valamilyen szempontrendszer szerint válogatott webhelyek, weboldalak, vagy akár egyedi dokumentumok)&lt;br /&gt;
** általános kategóriák (pl. oktatási, tudományos, kormányzati webhelyek)&lt;br /&gt;
** szűkebb témák (pl. adott szakterülethez, földrajzi helyhez, intézményhez, személyhez kötődő tartalmak)&lt;br /&gt;
** események (pl. választások, katasztrófák, háborúk idején minden róluk megjelent tartalom)&lt;br /&gt;
** műfaj (pl. e-folyóiratok, hírportálok, Twitter-üzenetek, Facebook-oldalak, videók)&lt;br /&gt;
* '''teljes körű''' (a lehatárolás csak automatikus módszerekkel történik, azon belül teljességre törekedve)&lt;br /&gt;
** világméretű (minden nyilvánosan elérhető online tartalom)&lt;br /&gt;
** világrész méretű (pl. Ausztrália és Óceánia, Skandinávia)&lt;br /&gt;
** nemzeti szintű (pl. a [[CcTLD|top-level ország-domain]] alatti, vagy az adott ország állampolgárai/intézményei által bejegyzett domain-ek alatti webhelyek, vagy az adott nemzeti nyelven íródott tartalmak, illetve az adott országgal és nemzettel kapcsolatos tartalmak bármely domain alatt)&lt;br /&gt;
** egyéb domainre vagy subdomainre kiterjedő (pl. minden .gov vagy minden ac.uk alatti webhely)&lt;br /&gt;
&lt;br /&gt;
== Az archiváló szerint ==&lt;br /&gt;
&lt;br /&gt;
* '''magánarchívum''' (pl. az illető által létrehozott és/vagy vele kapcsolatos, őt érdeklő online tartalmak lementései)&lt;br /&gt;
* '''céges archívum''' (pl. egy adott vállalat által létrehozott és/vagy vele, illetve a versenytársaival/piacával kapcsolatos online tartalmak lementései)&lt;br /&gt;
* '''intézményi archívum''' (pl. egy könyvtár gyűjtőkörébe tartozó vagy egy kutatóintézet szakterületéhez kapcsolódó webes tartalmak gyűjteménye)&lt;br /&gt;
* '''országos archívum''' (pl. a nemzeti örökség hosszú távú megőrzése céljából a nemzeti könyvtár, vagy levéltár, vagy valamilyen konzorcium által fenntartott archívum)&lt;br /&gt;
&lt;br /&gt;
== A tárolási mód szerint ==&lt;br /&gt;
&lt;br /&gt;
* '''fájlrendszerbe mentés''' (a weboldalt alkotó fájlok egyenkénti tárolása, az eredeti fájlnevek megőrzésével vagy átnevezésével, és a linkek relatívvá tételével, hogy az archív példány is navigálható maradjon)&lt;br /&gt;
* '''archív állományba mentés''' (a weboldalakat alkotó objektumoknak és azok technikai metaadatainak nagy fájlokba mentése pl. [[WARC]] formátumú csomagokat képezve)&lt;br /&gt;
* '''egységes formátumba mentés''' (a weboldalak tartalmának és/vagy kinézetének megőrzése azok eredeti szerkezetének megtartása nélkül, pl. egységesen XML formátumra konvertálva, vagy [[PDF A|PDF/A]] fájlba &amp;quot;nyomtatva&amp;quot; őket, vagy pl. PNG képeket készítve róluk)&lt;br /&gt;
* '''adatbázisba mentés''' (elsősorban nem webhelyek, hanem pl. elektronikus levelek, tweetek, blogbejegyzések, Facebook-postok, hírportálokról letöltött cikkek stb. adatbázis-rekordokként való tárolása)&lt;br /&gt;
&lt;br /&gt;
== A mentés módja szerint ==&lt;br /&gt;
&lt;br /&gt;
* '''aratással''' (egy [[crawler]] végzi a gyűjtést az eredeti webhelyről vagy a szolgáltató által &amp;quot;crawler-baráttá&amp;quot; tett felületről vagy RSS-feedről – beállított paraméterek szerint követve a linkeket és archív csomagokat képezve)&lt;br /&gt;
* '''letöltőalkalmazással''' (egy weboldalak lementésére készült szoftverrel vagy böngészőkiegészítővel adott weboldal, vagy adott webhely, vagy adott URL címlista lementése, rendszerint fájlrendszerbe)&lt;br /&gt;
* '''push technikával''' (a tartalmat vagy az eredeti szolgáltató szerver küldi be az archívumba, valamilyen szabványos adatcsere protokollon keresztül, pl. rendszeresen tükrözve a teljes site-ot/adatbázist vagy annak XML-be kimentett tartalmát, ill. csak az újdonságokat/változásokat, vagy valamilyen proxy szerver küld be egy másolatot az archívumba minden rajta áthaladó (a felhasználók kliensei által kért) digitális objektumból.&lt;br /&gt;
* '''depozitként''' (az eredeti tartalomgazdák valamilyen offline hordozón adják be alkalmanként a webhelyük tartalmának aktuális másolatát, vagy egy személy/örököse küldi be az online anyagait digitális hagyatékként)&lt;br /&gt;
&lt;br /&gt;
== Gyakoriság és idődimenzió szerint ==&lt;br /&gt;
&lt;br /&gt;
* '''ismétlődő mentések hosszú távú megőrzéssel''' (egy-egy website rendszeres mentése, lehetőleg a webhely változékonyságához optimalizálva, adott időpontbeli állapot visszaállításának lehetőségével, hosszú távra tervezve)&lt;br /&gt;
* '''ismétlődő mentések az utolsó állapotot megőrizve''' (egy-egy website rendszeres mentése, de a korábbi változatok megőrzése nélkül, pl. a keresőrendszerek számára szükséges indexeléshez, vagy pl. egy piaci szegmens aktuális állapotát kutató adatbányászathoz)&lt;br /&gt;
* '''egyedi vagy alkalmi mentések''' (egy-egy webhely, vagy weblap, vagy webkettes tartalom, vagy dokumentum egyszeri vagy alkalomszerű mentése (pl. hogy egy publikációban stabil URI-val lehessen rá hivatkozni, vagy hogy bizonyítékként felhasználható legyen egy jogi eljárásban)&lt;br /&gt;
&lt;br /&gt;
[[Category:FOGALMAK]]&lt;/div&gt;</summary>
		<author><name>Gyula</name></author>
		
	</entry>
	<entry>
		<id>https://webarchivum.oszk.hu/mediawiki/index.php?title=Arch%C3%ADvumt%C3%ADpusok&amp;diff=1705</id>
		<title>Archívumtípusok</title>
		<link rel="alternate" type="text/html" href="https://webarchivum.oszk.hu/mediawiki/index.php?title=Arch%C3%ADvumt%C3%ADpusok&amp;diff=1705"/>
		<updated>2023-03-01T12:33:35Z</updated>

		<summary type="html">&lt;p&gt;Gyula: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Az interneten található tartalom megőrzésének többféle módszere alakult ki, és előfordul, hogy ezek egy archívumon belül is keverednek, részhalmazokat alkotva a teljes gyűjteményen belül. A típusok csoportosíthatók:&lt;br /&gt;
&lt;br /&gt;
== Gyűjtőkör szerint ==&lt;br /&gt;
&lt;br /&gt;
* '''szelektív''' (valamilyen szempontrendszer szerint válogatott webhelyek, weboldalak, vagy akár egyedi dokumentumok)&lt;br /&gt;
** általános kategóriák (pl. oktatási, tudományos, kormányzati webhelyek)&lt;br /&gt;
** szűkebb témák (pl. adott szakterülethez, földrajzi helyhez, intézményhez, személyhez kötődő tartalmak)&lt;br /&gt;
** események (pl. választások, katasztrófák, háborúk idején minden róluk megjelent tartalom)&lt;br /&gt;
** műfaj (pl. e-folyóiratok, hírportálok, Twitter-üzenetek, Facebook-oldalak, videók)&lt;br /&gt;
* '''teljes körű''' (a lehatárolás csak automatikus módszerekkel történik, azon belül teljességre törekedve)&lt;br /&gt;
** világméretű (minden nyilvánosan elérhető online tartalom)&lt;br /&gt;
** világrész méretű (pl. Ausztrália és Óceánia, Skandinávia)&lt;br /&gt;
** nemzeti szintű (pl. a [[CcTLD|top-level ország-domain]] alatti, vagy az adott ország állampolgárai/intézményei által bejegyzett domain-ek alatti webhelyek, vagy az adott nemzeti nyelven íródott tartalmak, illetve az adott országgal és nemzettel kapcsolatos tartalmak bármely domain alatt)&lt;br /&gt;
** egyéb domainre vagy subdomainre kiterjedő (pl. minden .gov vagy minden ac.uk alatti webhely)&lt;br /&gt;
&lt;br /&gt;
== Az archiváló szerint ==&lt;br /&gt;
&lt;br /&gt;
* '''magán archívum''' (pl. az illető által létrehozott és/vagy vele kapcsolatos, őt érdeklő online tartalmak lementései)&lt;br /&gt;
* '''céges archívum''' (pl. egy adott vállalat által létrehozott és/vagy vele, illetve a versenytársaival/piacával kapcsolatos online tartalmak lementései)&lt;br /&gt;
* '''intézményi archívum''' (pl. egy könyvtár gyűjtőkörébe tartozó vagy egy kutatóintézet szakterületéhez kapcsolódó webes tartalmak gyűjteménye)&lt;br /&gt;
* '''országos archívum''' (pl. a nemzeti örökség hosszú távú megőrzése céljából a nemzeti könyvtár, vagy levéltár, vagy valamilyen konzorcium által fenntartott archívum)&lt;br /&gt;
&lt;br /&gt;
== A tárolási mód szerint ==&lt;br /&gt;
&lt;br /&gt;
* '''fájlrendszerbe mentés''' (a weboldalt alkotó fájlok egyenkénti tárolása, az eredeti fájlnevek megőrzésével vagy átnevezésével, és a linkek relatívvá tételével, hogy az archív példány is navigálható maradjon)&lt;br /&gt;
* '''archív állományba mentés''' (a weboldalakat alkotó objektumoknak és azok technikai metaadatainak nagy fájlokba mentése pl. [[WARC]] formátumú csomagokat képezve)&lt;br /&gt;
* '''egységes formátumba mentés''' (a weboldalak tartalmának és/vagy kinézetének megőrzése azok eredeti szerkezetének megtartása nélkül, pl. egységesen XML formátumra konvertálva, vagy [[PDF A|PDF/A]] fájlba &amp;quot;nyomtatva&amp;quot; őket, vagy pl. PNG képeket készítve róluk)&lt;br /&gt;
* '''adatbázisba mentés''' (elsősorban nem webhelyek, hanem pl. elektronikus levelek, tweetek, blogbejegyzések, Facebook-postok, hírportálokról letöltött cikkek stb. adatbázis-rekordokként való tárolása)&lt;br /&gt;
&lt;br /&gt;
== A mentés módja szerint ==&lt;br /&gt;
&lt;br /&gt;
* '''aratással''' (egy [[crawler]] végzi a gyűjtést az eredeti webhelyről vagy a szolgáltató által &amp;quot;crawler-baráttá&amp;quot; tett felületről vagy RSS-feedről – beállított paraméterek szerint követve a linkeket és archív csomagokat képezve)&lt;br /&gt;
* '''letöltőalkalmazással''' (egy weboldalak lementésére készült szoftverrel vagy böngészőkiegészítővel adott weboldal, vagy adott webhely, vagy adott URL címlista lementése, rendszerint fájlrendszerbe)&lt;br /&gt;
* '''push technikával''' (a tartalmat vagy az eredeti szolgáltató szerver küldi be az archívumba, valamilyen szabványos adatcsere protokollon keresztül, pl. rendszeresen tükrözve a teljes site-ot/adatbázist vagy annak XML-be kimentett tartalmát, ill. csak az újdonságokat/változásokat, vagy valamilyen proxy szerver küld be egy másolatot az archívumba minden rajta áthaladó (a felhasználók kliensei által kért) digitális objektumból.&lt;br /&gt;
* '''depozitként''' (az eredeti tartalomgazdák valamilyen offline hordozón adják be alkalmanként a webhelyük tartalmának aktuális másolatát, vagy egy személy/örököse küldi be az online anyagait digitális hagyatékként)&lt;br /&gt;
&lt;br /&gt;
== Gyakoriság és idődimenzió szerint ==&lt;br /&gt;
&lt;br /&gt;
* '''ismétlődő mentések hosszú távú megőrzéssel''' (egy-egy website rendszeres mentése, lehetőleg a webhely változékonyságához optimalizálva, adott időpontbeli állapot visszaállításának lehetőségével, hosszú távra tervezve)&lt;br /&gt;
* '''ismétlődő mentések az utolsó állapotot megőrizve''' (egy-egy website rendszeres mentése, de a korábbi változatok megőrzése nélkül, pl. a keresőrendszerek számára szükséges indexeléshez, vagy pl. egy piaci szegmens aktuális állapotát kutató adatbányászathoz)&lt;br /&gt;
* '''egyedi vagy alkalmi mentések''' (egy-egy webhely, vagy weblap, vagy webkettes tartalom, vagy dokumentum egyszeri vagy alkalomszerű mentése (pl. hogy egy publikációban stabil URI-val lehessen rá hivatkozni, vagy hogy bizonyítékként felhasználható legyen egy jogi eljárásban)&lt;br /&gt;
&lt;br /&gt;
[[Category:FOGALMAK]]&lt;/div&gt;</summary>
		<author><name>Gyula</name></author>
		
	</entry>
	<entry>
		<id>https://webarchivum.oszk.hu/mediawiki/index.php?title=Arch%C3%ADvumt%C3%ADpusok&amp;diff=1704</id>
		<title>Archívumtípusok</title>
		<link rel="alternate" type="text/html" href="https://webarchivum.oszk.hu/mediawiki/index.php?title=Arch%C3%ADvumt%C3%ADpusok&amp;diff=1704"/>
		<updated>2023-03-01T12:33:06Z</updated>

		<summary type="html">&lt;p&gt;Gyula: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Az interneten található tartalom megőrzésének többféle módszere alakult ki, és előfordul, hogy ezek egy archívumon belül is keverednek, részhalmazokat alkotva a teljes gyűjteményen belül. A típusok csoportosíthatók:&lt;br /&gt;
&lt;br /&gt;
== Gyűjtőkör szerint ==&lt;br /&gt;
&lt;br /&gt;
* '''szelektív''' (valamilyen szempontrendszer szerint válogatott webhelyek, weboldalak, vagy akár egyedi dokumentumok)&lt;br /&gt;
** általános kategóriák (pl. oktatási, tudományos, kormányzati webhelyek)&lt;br /&gt;
** szűkebb témák (pl. adott szakterülethez, földrajzi helyhez, intézményhez, személyhez kötődő tartalmak)&lt;br /&gt;
** események (pl. választások, katasztrófák, háborúk idején minden róluk megjelent tartalom)&lt;br /&gt;
** műfaj (pl. e-folyóiratok, hírportálok, Twitter-üzenetek, Facebook-oldalak, videók)&lt;br /&gt;
* '''teljes körű''' (a lehatárolás csak automatikus módszerekkel történik, azon belül teljességre törekedve)&lt;br /&gt;
** világméretű (minden nyilvánosan elérhető online tartalom)&lt;br /&gt;
** világrész méretű (pl. Ausztrália és Óceánia, Skandinávia)&lt;br /&gt;
** nemzeti szintű (pl. a [[CcTLD|top-level ország-domain]] alatti, vagy az adott ország állampolgárai/intézményei által bejegyzett domain-ek alatti webhelyek, vagy az adott nemzeti nyelven íródott tartalmak, illetve az adott országgal és nemzettel kapcsolatos tartalmak bármely domain alatt)&lt;br /&gt;
** egyéb domainre vagy subdomainre kiterjedő (pl. minden .gov vagy minden ac.uk alatti webhely)&lt;br /&gt;
&lt;br /&gt;
== Az archiváló szerint ==&lt;br /&gt;
&lt;br /&gt;
* '''magán archívum''' (pl. az illető által létrehozott és/vagy vele kapcsolatos, őt érdeklő online tartalmak lementései)&lt;br /&gt;
* '''céges archívum''' (pl. egy adott vállalat által létrehozott és/vagy vele, illetve a versenytársaival/piacával kapcsolatos online tartalmak lementései)&lt;br /&gt;
* '''intézményi archívum''' (pl. egy könyvtár gyűjtőkörébe tartozó vagy egy kutatóintézet szakterületéhez kapcsolódó webes tartalmak gyűjteménye)&lt;br /&gt;
* '''országos archívum''' (pl. a nemzeti örökség hosszú távú megőrzése céljából a nemzeti könyvtár, vagy levéltár, vagy valamilyen konzorcium által fenntartott archívum)&lt;br /&gt;
&lt;br /&gt;
== A tárolási mód szerint ==&lt;br /&gt;
&lt;br /&gt;
* '''fájlrendszerbe mentés''' (a weboldalt alkotó fájlok egyenkénti tárolása, az eredeti fájlnevek megőrzésével vagy átnevezésével, és a linkek relatívvá tételével, hogy az archív példány is navigálható maradjon)&lt;br /&gt;
* '''archív állományba mentés''' (a weboldalakat alkotó objektumoknak és azok technikai metaadatainak nagy fájlokba mentése pl. [[WARC]] formátumú csomagokat képezve)&lt;br /&gt;
* '''egységes formátumba mentés''' (a weboldalak tartalmának és/vagy kinézetének megőrzése azok eredeti szerkezetének megtartása nélkül, pl. egységesen XML formátumra konvertálva, vagy [[PDF A|PDF/A]] fájlba &amp;quot;nyomtatva&amp;quot; őket, vagy pl. PNG képeket készítve róluk)&lt;br /&gt;
* '''adatbázisba mentés''' (elsősorban nem webhelyek, hanem pl. elektronikus levelek, tweetek, blogbejegyzések, Facebook-postok, hírportálokról letöltött cikkek stb. adatbázis-rekordokként való tárolása)&lt;br /&gt;
&lt;br /&gt;
== A mentés módja szerint ==&lt;br /&gt;
&lt;br /&gt;
* '''aratással''' (egy [[crawler]] végzi a gyűjtést az eredeti webhelyről vagy a szolgáltató által &amp;quot;crawler-baráttá&amp;quot; tett felületről vagy RSS-feedről – beállított paraméterek szerint követve a linkeket és archív csomagokat képezve)&lt;br /&gt;
* '''letöltő alkalmazással''' (egy weboldalak lementésére készült szoftverrel vagy böngészőkiegészítővel adott weboldal, vagy adott webhely, vagy adott URL címlista lementése, rendszerint fájlrendszerbe)&lt;br /&gt;
* '''push technikával''' (a tartalmat vagy az eredeti szolgáltató szerver küldi be az archívumba, valamilyen szabványos adatcsere protokollon keresztül, pl. rendszeresen tükrözve a teljes site-ot/adatbázist vagy annak XML-be kimentett tartalmát, ill. csak az újdonságokat/változásokat, vagy valamilyen proxy szerver küld be egy másolatot az archívumba minden rajta áthaladó (a felhasználók kliensei által kért) digitális objektumból.&lt;br /&gt;
* '''depozitként''' (az eredeti tartalomgazdák valamilyen offline hordozón adják be alkalmanként a webhelyük tartalmának aktuális másolatát, vagy egy személy/örököse küldi be az online anyagait digitális hagyatékként)&lt;br /&gt;
&lt;br /&gt;
== Gyakoriság és idődimenzió szerint ==&lt;br /&gt;
&lt;br /&gt;
* '''ismétlődő mentések hosszú távú megőrzéssel''' (egy-egy website rendszeres mentése, lehetőleg a webhely változékonyságához optimalizálva, adott időpontbeli állapot visszaállításának lehetőségével, hosszú távra tervezve)&lt;br /&gt;
* '''ismétlődő mentések az utolsó állapotot megőrizve''' (egy-egy website rendszeres mentése, de a korábbi változatok megőrzése nélkül, pl. a keresőrendszerek számára szükséges indexeléshez, vagy pl. egy piaci szegmens aktuális állapotát kutató adatbányászathoz)&lt;br /&gt;
* '''egyedi vagy alkalmi mentések''' (egy-egy webhely, vagy weblap, vagy webkettes tartalom, vagy dokumentum egyszeri vagy alkalomszerű mentése (pl. hogy egy publikációban stabil URI-val lehessen rá hivatkozni, vagy hogy bizonyítékként felhasználható legyen egy jogi eljárásban)&lt;br /&gt;
&lt;br /&gt;
[[Category:FOGALMAK]]&lt;/div&gt;</summary>
		<author><name>Gyula</name></author>
		
	</entry>
	<entry>
		<id>https://webarchivum.oszk.hu/mediawiki/index.php?title=Arch%C3%ADvumt%C3%ADpusok&amp;diff=1703</id>
		<title>Archívumtípusok</title>
		<link rel="alternate" type="text/html" href="https://webarchivum.oszk.hu/mediawiki/index.php?title=Arch%C3%ADvumt%C3%ADpusok&amp;diff=1703"/>
		<updated>2023-03-01T12:31:22Z</updated>

		<summary type="html">&lt;p&gt;Gyula: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Az interneten található tartalom megőrzésének többféle módszere alakult ki, és előfordul, hogy ezek egy archívumon belül is keverednek, részhalmazokat alkotva a teljes gyűjteményen belül. A típusok csoportosíthatók:&lt;br /&gt;
&lt;br /&gt;
== Gyűjtőkör szerint ==&lt;br /&gt;
&lt;br /&gt;
* '''szelektív''' (valamilyen szempontrendszer szerint válogatott webhelyek, weboldalak, vagy akár egyedi dokumentumok)&lt;br /&gt;
** általános kategóriák (pl. oktatási, tudományos, kormányzati webhelyek)&lt;br /&gt;
** szűkebb témák (pl. adott szakterülethez, földrajzi helyhez, intézményhez, személyhez kötődő tartalmak)&lt;br /&gt;
** események (pl. választások, katasztrófák, háborúk idején minden róluk megjelent tartalom)&lt;br /&gt;
** műfaj (pl. e-folyóiratok, hírportálok, Twitter-üzenetek, Facebook-oldalak, videók)&lt;br /&gt;
* '''teljes körű''' (a lehatárolás csak automatikus módszerekkel történik, azon belül teljességre törekedve)&lt;br /&gt;
** világméretű (minden nyilvánosan elérhető online tartalom)&lt;br /&gt;
** világrész méretű (pl. Ausztrália és Óceánia, Skandinávia)&lt;br /&gt;
** nemzeti szintű (pl. a [[CcTLD|top-level ország-domain]] alatti, vagy az adott ország állampolgárai/intézményei által bejegyzett domain-ek alatti webhelyek, vagy az adott nemzeti nyelven íródott tartalmak, illetve az adott országgal és nemzettel kapcsolatos tartalmak bármely domain alatt)&lt;br /&gt;
** egyéb domainre vagy subdomainre kiterjedő (pl. minden .gov vagy minden ac.uk alatti webhely)&lt;br /&gt;
&lt;br /&gt;
== Az archiváló szerint ==&lt;br /&gt;
&lt;br /&gt;
* '''magán archívum''' (pl. az illető által létrehozott és/vagy vele kapcsolatos, őt érdeklő online tartalmak lementései)&lt;br /&gt;
* '''céges archívum''' (pl. egy adott vállalat által létrehozott és/vagy vele, illetve a versenytársaival/piacával kapcsolatos online tartalmak lementései)&lt;br /&gt;
* '''intézményi archívum''' (pl. egy könyvtár gyűjtőkörébe tartozó vagy egy kutatóintézet szakterületéhez kapcsolódó webes tartalmak gyűjteménye)&lt;br /&gt;
* '''országos archívum''' (pl. a nemzeti örökség hosszú távú megőrzése céljából a nemzeti könyvtár, vagy levéltár, vagy valamilyen konzorcium által fenntartott archívum)&lt;br /&gt;
&lt;br /&gt;
== A tárolási mód szerint ==&lt;br /&gt;
&lt;br /&gt;
* '''fájlrendszerbe mentés''' (a weboldalt alkotó fájlok egyenkénti tárolása, az eredeti fájlnevek megőrzésével vagy átnevezésével, és a linkek relatívvá tételével, hogy az archív példány is navigálható maradjon)&lt;br /&gt;
* '''archív állományba mentés''' (a weboldalakat alkotó objektumoknak és azok technikai metaadatainak nagy fájlokba mentése pl. [[WARC]] formátumú csomagokat képezve)&lt;br /&gt;
* '''egységes formátumba mentés''' (a weboldalak tartalmának és/vagy kinézetének megőrzése azok eredeti szerkezetének megtartása nélkül, pl. egységesen XML formátumra konvertálva, vagy [[PDF A|PDF/A]] fájlba &amp;quot;nyomtatva&amp;quot; őket, vagy pl. PNG képeket készítve róluk)&lt;br /&gt;
* '''adatbázisba mentés''' (elsősorban nem webhelyek, hanem pl. elektronikus levelek, tweetek, blogbejegyzések, Facebook-postok, hírportálokról letöltött cikkek stb. adatbázis-rekordokként való tárolása)&lt;br /&gt;
&lt;br /&gt;
== A mentés módja szerint ==&lt;br /&gt;
&lt;br /&gt;
* '''aratással''' (egy [[crawler]] végzi a gyűjtést az eredeti webhelyről, vagy a szolgáltató által &amp;quot;crawler-baráttá&amp;quot; tett felületről, vagy RSS feedről - beállított paraméterek szerint követve a linkeket és archív csomagokat képezve)&lt;br /&gt;
* '''letöltő alkalmazással''' (egy weboldalak lementésére készült szoftverrel vagy böngészőkiegészítővel adott weboldal, vagy adott webhely, vagy adott URL címlista lementése, rendszerint fájlrendszerbe)&lt;br /&gt;
* '''push technikával''' (a tartalmat vagy az eredeti szolgáltató szerver küldi be az archívumba, valamilyen szabványos adatcsere protokollon keresztül, pl. rendszeresen tükrözve a teljes site-ot/adatbázist vagy annak XML-be kimentett tartalmát, ill. csak az újdonságokat/változásokat, vagy valamilyen proxy szerver küld be egy másolatot az archívumba minden rajta áthaladó (a felhasználók kliensei által kért) digitális objektumból.&lt;br /&gt;
* '''depozitként''' (az eredeti tartalomgazdák valamilyen offline hordozón adják be alkalmanként a webhelyük tartalmának aktuális másolatát, vagy egy személy/örököse küldi be az online anyagait digitális hagyatékként)&lt;br /&gt;
&lt;br /&gt;
== Gyakoriság és idődimenzió szerint ==&lt;br /&gt;
&lt;br /&gt;
* '''ismétlődő mentések hosszú távú megőrzéssel''' (egy-egy website rendszeres mentése, lehetőleg a webhely változékonyságához optimalizálva, adott időpontbeli állapot visszaállításának lehetőségével, hosszú távra tervezve)&lt;br /&gt;
* '''ismétlődő mentések az utolsó állapotot megőrizve''' (egy-egy website rendszeres mentése, de a korábbi változatok megőrzése nélkül, pl. a keresőrendszerek számára szükséges indexeléshez, vagy pl. egy piaci szegmens aktuális állapotát kutató adatbányászathoz)&lt;br /&gt;
* '''egyedi vagy alkalmi mentések''' (egy-egy webhely, vagy weblap, vagy webkettes tartalom, vagy dokumentum egyszeri vagy alkalomszerű mentése (pl. hogy egy publikációban stabil URI-val lehessen rá hivatkozni, vagy hogy bizonyítékként felhasználható legyen egy jogi eljárásban)&lt;br /&gt;
&lt;br /&gt;
[[Category:FOGALMAK]]&lt;/div&gt;</summary>
		<author><name>Gyula</name></author>
		
	</entry>
	<entry>
		<id>https://webarchivum.oszk.hu/mediawiki/index.php?title=Arch%C3%ADvumt%C3%ADpusok&amp;diff=1702</id>
		<title>Archívumtípusok</title>
		<link rel="alternate" type="text/html" href="https://webarchivum.oszk.hu/mediawiki/index.php?title=Arch%C3%ADvumt%C3%ADpusok&amp;diff=1702"/>
		<updated>2023-03-01T12:29:55Z</updated>

		<summary type="html">&lt;p&gt;Gyula: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Az interneten található tartalom megőrzésének többféle módszere alakult ki, és előfordul, hogy ezek egy archívumon belül is keverednek, részhalmazokat alkotva a teljes gyűjteményen belül. A típusok csoportosíthatók:&lt;br /&gt;
&lt;br /&gt;
== Gyűjtőkör szerint ==&lt;br /&gt;
&lt;br /&gt;
* '''szelektív''' (valamilyen szempontrendszer szerint válogatott webhelyek, weboldalak, vagy akár egyedi dokumentumok)&lt;br /&gt;
** általános kategóriák (pl. oktatási, tudományos, kormányzati webhelyek)&lt;br /&gt;
** szűkebb témák (pl. adott szakterülethez, földrajzi helyhez, intézményhez, személyhez kötődő tartalmak)&lt;br /&gt;
** események (pl. választások, katasztrófák, háborúk idején minden róluk megjelent tartalom)&lt;br /&gt;
** műfaj (pl. e-folyóiratok, hírportálok, Twitter üzenetek, Facebook oldalak, videók)&lt;br /&gt;
* '''teljes körű''' (a lehatárolás csak automatikus módszerekkel történik, azon belül teljességre törekedve)&lt;br /&gt;
** világméretű (minden nyilvánosan elérhető online tartalom)&lt;br /&gt;
** világrész méretű (pl. Ausztrália és Óceánia, Skandinávia)&lt;br /&gt;
** nemzeti szintű (pl. a [[CcTLD|top-level ország-domain]] alatti, vagy az adott ország állampolgárai/intézményei által bejegyzett domain-ek alatti webhelyek, vagy az adott nemzeti nyelven íródott tartalmak, illetve az adott országgal és nemzettel kapcsolatos tartalmak bármely domain alatt)&lt;br /&gt;
** egyéb domainre vagy subdomainre kiterjedő (pl. minden .gov vagy minden ac.uk alatti webhely)&lt;br /&gt;
&lt;br /&gt;
== Az archiváló szerint ==&lt;br /&gt;
&lt;br /&gt;
* '''magán archívum''' (pl. az illető által létrehozott és/vagy vele kapcsolatos, őt érdeklő online tartalmak lementései)&lt;br /&gt;
* '''céges archívum''' (pl. egy adott vállalat által létrehozott és/vagy vele, illetve a versenytársaival/piacával kapcsolatos online tartalmak lementései)&lt;br /&gt;
* '''intézményi archívum''' (pl. egy könyvtár gyűjtőkörébe tartozó vagy egy kutatóintézet szakterületéhez kapcsolódó webes tartalmak gyűjteménye)&lt;br /&gt;
* '''országos archívum''' (pl. a nemzeti örökség hosszú távú megőrzése céljából a nemzeti könyvtár, vagy levéltár, vagy valamilyen konzorcium által fenntartott archívum)&lt;br /&gt;
&lt;br /&gt;
== A tárolási mód szerint ==&lt;br /&gt;
&lt;br /&gt;
* '''fájlrendszerbe mentés''' (a weboldalt alkotó fájlok egyenkénti tárolása, az eredeti fájlnevek megőrzésével vagy átnevezésével, és a linkek relatívvá tételével, hogy az archív példány is navigálható maradjon)&lt;br /&gt;
* '''archív állományba mentés''' (a weboldalakat alkotó objektumoknak és azok technikai metaadatainak nagy fájlokba mentése pl. [[WARC]] formátumú csomagokat képezve)&lt;br /&gt;
* '''egységes formátumba mentés''' (a weboldalak tartalmának és/vagy kinézetének megőrzése azok eredeti szerkezetének megtartása nélkül, pl. egységesen XML formátumra konvertálva, vagy [[PDF A|PDF/A]] fájlba &amp;quot;nyomtatva&amp;quot; őket, vagy pl. PNG képeket készítve róluk)&lt;br /&gt;
* '''adatbázisba mentés''' (elsősorban nem webhelyek, hanem pl. elektronikus levelek, tweetek, blogbejegyzések, Facebook-postok, hírportálokról letöltött cikkek stb. adatbázis-rekordokként való tárolása)&lt;br /&gt;
&lt;br /&gt;
== A mentés módja szerint ==&lt;br /&gt;
&lt;br /&gt;
* '''aratással''' (egy [[crawler]] végzi a gyűjtést az eredeti webhelyről, vagy a szolgáltató által &amp;quot;crawler-baráttá&amp;quot; tett felületről, vagy RSS feedről - beállított paraméterek szerint követve a linkeket és archív csomagokat képezve)&lt;br /&gt;
* '''letöltő alkalmazással''' (egy weboldalak lementésére készült szoftverrel vagy böngészőkiegészítővel adott weboldal, vagy adott webhely, vagy adott URL címlista lementése, rendszerint fájlrendszerbe)&lt;br /&gt;
* '''push technikával''' (a tartalmat vagy az eredeti szolgáltató szerver küldi be az archívumba, valamilyen szabványos adatcsere protokollon keresztül, pl. rendszeresen tükrözve a teljes site-ot/adatbázist vagy annak XML-be kimentett tartalmát, ill. csak az újdonságokat/változásokat, vagy valamilyen proxy szerver küld be egy másolatot az archívumba minden rajta áthaladó (a felhasználók kliensei által kért) digitális objektumból.&lt;br /&gt;
* '''depozitként''' (az eredeti tartalomgazdák valamilyen offline hordozón adják be alkalmanként a webhelyük tartalmának aktuális másolatát, vagy egy személy/örököse küldi be az online anyagait digitális hagyatékként)&lt;br /&gt;
&lt;br /&gt;
== Gyakoriság és idődimenzió szerint ==&lt;br /&gt;
&lt;br /&gt;
* '''ismétlődő mentések hosszú távú megőrzéssel''' (egy-egy website rendszeres mentése, lehetőleg a webhely változékonyságához optimalizálva, adott időpontbeli állapot visszaállításának lehetőségével, hosszú távra tervezve)&lt;br /&gt;
* '''ismétlődő mentések az utolsó állapotot megőrizve''' (egy-egy website rendszeres mentése, de a korábbi változatok megőrzése nélkül, pl. a keresőrendszerek számára szükséges indexeléshez, vagy pl. egy piaci szegmens aktuális állapotát kutató adatbányászathoz)&lt;br /&gt;
* '''egyedi vagy alkalmi mentések''' (egy-egy webhely, vagy weblap, vagy webkettes tartalom, vagy dokumentum egyszeri vagy alkalomszerű mentése (pl. hogy egy publikációban stabil URI-val lehessen rá hivatkozni, vagy hogy bizonyítékként felhasználható legyen egy jogi eljárásban)&lt;br /&gt;
&lt;br /&gt;
[[Category:FOGALMAK]]&lt;/div&gt;</summary>
		<author><name>Gyula</name></author>
		
	</entry>
	<entry>
		<id>https://webarchivum.oszk.hu/mediawiki/index.php?title=Arch%C3%ADvumt%C3%ADpusok&amp;diff=1701</id>
		<title>Archívumtípusok</title>
		<link rel="alternate" type="text/html" href="https://webarchivum.oszk.hu/mediawiki/index.php?title=Arch%C3%ADvumt%C3%ADpusok&amp;diff=1701"/>
		<updated>2023-03-01T12:29:42Z</updated>

		<summary type="html">&lt;p&gt;Gyula: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Az interneten található tartalom megőrzésének többféle módszere alakult ki, és előfordul, hogy ezek egy archívumon belül is keverednek, részhalmazokat alkotva a teljes gyűjteményen belül. A típusok csoportosíthatók:&lt;br /&gt;
&lt;br /&gt;
== Gyűjtőkör szerint ==&lt;br /&gt;
&lt;br /&gt;
* '''szelektív''' (valamilyen szempontrendszer szerint válogatott webhelyek, weboldalak, vagy akár egyedi dokumentumok)&lt;br /&gt;
** általános kategóriák (pl. oktatási, tudományos, kormányzati webhelyek)&lt;br /&gt;
** szűkebb témák (pl. adott szakterülethez, földrajzi helyhez, intézményhez, személyhez kötődő tartalmak)&lt;br /&gt;
** események (pl. választások, katasztrófák, háborúk idején minden róluk megjelent tartalom)&lt;br /&gt;
** műfaj (pl. e-folyóiratok, hírportálok, Twitter üzenetek, Facebook oldalak, videók)&lt;br /&gt;
* '''teljes körű''' (a lehatárolás csak automatikus módszerekkel történik, azon belül teljességre törekedve)&lt;br /&gt;
** világméretű (minden nyilvánosan elérhető online tartalom)&lt;br /&gt;
** világrész méretű (pl. Ausztrália és Óceánia, Skandinávia)&lt;br /&gt;
** nemzeti szintű (pl. a [[CcTLD|top-level ország-domain]] alatti, vagy az adott ország állampolgárai/intézményei által bejegyzett domain-ek alatti webhelyek, vagy az adott nemzeti nyelven íródott tartalmak, illetve az adott országgal és nemzettel kapcsolatos tartalmak bármely domain alatt)&lt;br /&gt;
** egyéb domainre vagy sub-domainre kiterjedő (pl. minden .gov vagy minden ac.uk alatti webhely)&lt;br /&gt;
&lt;br /&gt;
== Az archiváló szerint ==&lt;br /&gt;
&lt;br /&gt;
* '''magán archívum''' (pl. az illető által létrehozott és/vagy vele kapcsolatos, őt érdeklő online tartalmak lementései)&lt;br /&gt;
* '''céges archívum''' (pl. egy adott vállalat által létrehozott és/vagy vele, illetve a versenytársaival/piacával kapcsolatos online tartalmak lementései)&lt;br /&gt;
* '''intézményi archívum''' (pl. egy könyvtár gyűjtőkörébe tartozó vagy egy kutatóintézet szakterületéhez kapcsolódó webes tartalmak gyűjteménye)&lt;br /&gt;
* '''országos archívum''' (pl. a nemzeti örökség hosszú távú megőrzése céljából a nemzeti könyvtár, vagy levéltár, vagy valamilyen konzorcium által fenntartott archívum)&lt;br /&gt;
&lt;br /&gt;
== A tárolási mód szerint ==&lt;br /&gt;
&lt;br /&gt;
* '''fájlrendszerbe mentés''' (a weboldalt alkotó fájlok egyenkénti tárolása, az eredeti fájlnevek megőrzésével vagy átnevezésével, és a linkek relatívvá tételével, hogy az archív példány is navigálható maradjon)&lt;br /&gt;
* '''archív állományba mentés''' (a weboldalakat alkotó objektumoknak és azok technikai metaadatainak nagy fájlokba mentése pl. [[WARC]] formátumú csomagokat képezve)&lt;br /&gt;
* '''egységes formátumba mentés''' (a weboldalak tartalmának és/vagy kinézetének megőrzése azok eredeti szerkezetének megtartása nélkül, pl. egységesen XML formátumra konvertálva, vagy [[PDF A|PDF/A]] fájlba &amp;quot;nyomtatva&amp;quot; őket, vagy pl. PNG képeket készítve róluk)&lt;br /&gt;
* '''adatbázisba mentés''' (elsősorban nem webhelyek, hanem pl. elektronikus levelek, tweetek, blogbejegyzések, Facebook-postok, hírportálokról letöltött cikkek stb. adatbázis-rekordokként való tárolása)&lt;br /&gt;
&lt;br /&gt;
== A mentés módja szerint ==&lt;br /&gt;
&lt;br /&gt;
* '''aratással''' (egy [[crawler]] végzi a gyűjtést az eredeti webhelyről, vagy a szolgáltató által &amp;quot;crawler-baráttá&amp;quot; tett felületről, vagy RSS feedről - beállított paraméterek szerint követve a linkeket és archív csomagokat képezve)&lt;br /&gt;
* '''letöltő alkalmazással''' (egy weboldalak lementésére készült szoftverrel vagy böngészőkiegészítővel adott weboldal, vagy adott webhely, vagy adott URL címlista lementése, rendszerint fájlrendszerbe)&lt;br /&gt;
* '''push technikával''' (a tartalmat vagy az eredeti szolgáltató szerver küldi be az archívumba, valamilyen szabványos adatcsere protokollon keresztül, pl. rendszeresen tükrözve a teljes site-ot/adatbázist vagy annak XML-be kimentett tartalmát, ill. csak az újdonságokat/változásokat, vagy valamilyen proxy szerver küld be egy másolatot az archívumba minden rajta áthaladó (a felhasználók kliensei által kért) digitális objektumból.&lt;br /&gt;
* '''depozitként''' (az eredeti tartalomgazdák valamilyen offline hordozón adják be alkalmanként a webhelyük tartalmának aktuális másolatát, vagy egy személy/örököse küldi be az online anyagait digitális hagyatékként)&lt;br /&gt;
&lt;br /&gt;
== Gyakoriság és idődimenzió szerint ==&lt;br /&gt;
&lt;br /&gt;
* '''ismétlődő mentések hosszú távú megőrzéssel''' (egy-egy website rendszeres mentése, lehetőleg a webhely változékonyságához optimalizálva, adott időpontbeli állapot visszaállításának lehetőségével, hosszú távra tervezve)&lt;br /&gt;
* '''ismétlődő mentések az utolsó állapotot megőrizve''' (egy-egy website rendszeres mentése, de a korábbi változatok megőrzése nélkül, pl. a keresőrendszerek számára szükséges indexeléshez, vagy pl. egy piaci szegmens aktuális állapotát kutató adatbányászathoz)&lt;br /&gt;
* '''egyedi vagy alkalmi mentések''' (egy-egy webhely, vagy weblap, vagy webkettes tartalom, vagy dokumentum egyszeri vagy alkalomszerű mentése (pl. hogy egy publikációban stabil URI-val lehessen rá hivatkozni, vagy hogy bizonyítékként felhasználható legyen egy jogi eljárásban)&lt;br /&gt;
&lt;br /&gt;
[[Category:FOGALMAK]]&lt;/div&gt;</summary>
		<author><name>Gyula</name></author>
		
	</entry>
	<entry>
		<id>https://webarchivum.oszk.hu/mediawiki/index.php?title=METS&amp;diff=1700</id>
		<title>METS</title>
		<link rel="alternate" type="text/html" href="https://webarchivum.oszk.hu/mediawiki/index.php?title=METS&amp;diff=1700"/>
		<updated>2022-12-02T14:14:46Z</updated>

		<summary type="html">&lt;p&gt;Gyula: Beraktam a szabványok kategóriába is.&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= (Metadata Encoding and Transmission Standard) =&lt;br /&gt;
&lt;br /&gt;
A Library of Congress és a Digital Library Federation által felügyelt nyílt szabvány a digitális objektumok leíró, technikai, adminisztrációs és szerkezeti metaadatainak XML formátumban való tárolására. Nagy előnye, hogy rugalmasan módosítható, bővíthető a legkülönbözőbb gyűjtemények és dokumentumtípusok jellemzőihez, és hogy a szerkezeti metaadatoknál az összetartozó fájlok közötti kapcsolatok, sorrendek és hierarchiák is leírhatók vele. Egy METS fájl max. hét szakaszból állhat: a header után a leíró és a adminisztrációs metaadatok jönnek, majd a fájl lista (ha több fájlból áll a digitális dokumentum), ezt követi a szerkezetet leíró &amp;quot;térkép&amp;quot;, majd pedig ezen &amp;quot;térkép&amp;quot; egyes csomópontjai közötti hiperlinkek (különösen hasznos lehetőség archivált webhelyek leírásához!), végül pedig lehet egy &amp;quot;behavioral&amp;quot; szekció, ahol megadhatók pl. a digitális objektum megjelenítése vagy konvertálása esetén szükséges alkalmazások, futtatandó programok. Az elterjedt dokumentumtípusokhoz (pl. könyvek, fotók, kották, hang- és videófeltételek) általánosan használt, &amp;quot;kvázi szabványnak&amp;quot; tekinthető METS profilok léteznek. Több webarchívumban is használják már a METS-t az archiválási és a megőrzési folyamat egyes fázisaiban keletkező metaadatokhoz.&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
&lt;br /&gt;
* [https://en.wikipedia.org/wiki/Metadata_Encoding_and_Transmission_Standard Wikipedia: Metadata Encoding and Transmission Standard]&lt;br /&gt;
* [http://www.loc.gov/standards/mets/ A METS a Library of Congress honlapján]&lt;br /&gt;
* [http://www.loc.gov/standards/mets/mets-tools.html METS Tools &amp;amp; Utilities]&lt;br /&gt;
* [https://www.bl.uk/ipres2008/presentations_day1/25_Steinke.pdf Tobias Steinke: Harvester results in a digital preservation system]&lt;br /&gt;
* [http://www.avarchivering.nl/node/1724?loc=kennisbank%2F82%2F85%2Fbron Markus Enders: A METS based information package for long term accessibility of web archives]&lt;br /&gt;
&lt;br /&gt;
[[Category:FOGALMAK]]&lt;br /&gt;
[[Category:SZABVÁNYOK]]&lt;/div&gt;</summary>
		<author><name>Gyula</name></author>
		
	</entry>
	<entry>
		<id>https://webarchivum.oszk.hu/mediawiki/index.php?title=OAIS&amp;diff=1699</id>
		<title>OAIS</title>
		<link rel="alternate" type="text/html" href="https://webarchivum.oszk.hu/mediawiki/index.php?title=OAIS&amp;diff=1699"/>
		<updated>2022-12-02T14:14:10Z</updated>

		<summary type="html">&lt;p&gt;Gyula: Beraktam a szabványok kategóriába is.&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= (Open Archival Information System) =&lt;br /&gt;
&lt;br /&gt;
A CCSDS (Consultative Committee for Space Data Systems) munkacsoport által eredetileg űrkutatási adatok megőrzésére kidolgozott, de ma már sokféle digitális archívumnál, elektronikus könyvtárnál is alkalmazott elméleti modell. Először 2002-ben szabványosították, az átdolgozott második változata 2012-ben lépett életbe. Egy olyan keretrendszert ír le, amely lefed minden feladatot, amivel egy hosszú távra tervezett archívum esetében foglalkozni kell. Csak elveket fogalmaz meg, semmilyen konkrét technológiához nem kötődik. &lt;br /&gt;
&lt;br /&gt;
Az információs modell része ilyen elemeket különböztet meg: &lt;br /&gt;
&lt;br /&gt;
* Content Information (a Content Data Object: maga az adat/dokumentum/objektum és a Representation Information: a megjelenítéséhez szükséges információk)&lt;br /&gt;
* Preservation Description Information (a megőrzéshez szükséges információk, pl. előélet, egyedi azonosító, [[checksum]], hozzáférési jogok)&lt;br /&gt;
* Packaging Information (az előző két információhalmaz egy csomagként való kezeléséhez szükséges információk, pl. egyszerű directory- és fájlnevek, vagy egy ennél részletesebb [[METS]] rekordok formájában)&lt;br /&gt;
* Descriptive Information (az objektum későbbi visszakereséséhez szükséges leíró adatok, pl. [[DC]] metaadatként)&lt;br /&gt;
&lt;br /&gt;
A referencia modell ezeket az információs csomagokat definiálja:&lt;br /&gt;
&lt;br /&gt;
* Submission Information Package (SIP) (a beadó által az archívumba beküldött csomag)&lt;br /&gt;
* Archival Information Package (AIP) (az archívumban való tárolásnál használt csomag)&lt;br /&gt;
* Dissemination Information Package (DIP) (a felhasználói kérés esetén küldött szolgáltatási csomag)&lt;br /&gt;
&lt;br /&gt;
A funkcionális modell főbb komponensei:&lt;br /&gt;
&lt;br /&gt;
* Ingest function (fogadja a SIP-et, AIP-re alakítja és átküldi az archívum tárolójába)&lt;br /&gt;
* Archival Storage function (fogadja a Ingest-től az AIP-okat, hosszú távú tárolóba teszi, szükség esetén migrálja őket, ellenőrzi, hogy nem hibásodnak-e meg, és kérés esetén átküldi a megfelelő AIP-ot az Access funkciónak)&lt;br /&gt;
* Data Management function (kezeli az AIP-okat leíró információkat, fogadja a keresőkérdéseket, találati listákat ad vissza, jelentéseket készít)&lt;br /&gt;
* Administration function (az archívum adminisztrációs feladatait látja el: kezeli a beadókkal és a felhasználókkal való kapcsolatokat, felügyeli a szabványok és szabályozások betartását, ellenőrzi a SIP csomagokat, hogy megfelelnek-e a beadási előírásoknak stb.)&lt;br /&gt;
* Preservation Planning function (a hosszú távú megőrzéssel kapcsolatos feladatokat végzi: részletes megőrzési és migrálási tervek, a technológiai változások figyelése, kockázatelemzés, javaslattétel frissítésre vagy migrálásra)&lt;br /&gt;
* Access function (tartalmazza a felhasználói felületet, igény esetén DIP-et generál a megfelelő AIP-ból és eljuttatja a felhasználóhoz)&lt;br /&gt;
&lt;br /&gt;
Ezek az elvek, elemek és funkciók jól alkalmazhatók a webarchívumok esetében is, több ilyen projekt (pl. [[PANDORA (ausztrál)|PANDORA]], [[NEDLIB]]\) kifejezetten az OAIS-t vette alapul a rendszere kialakításánál, és a legtöbb digitális megőrzésre kidolgozott szoftver is már erre épül.&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
&lt;br /&gt;
* [https://en.wikipedia.org/wiki/Open_Archival_Information_System Wikipedia: Open Archival Information System]&lt;br /&gt;
* [http://www.oclc.org/research/publications/library/2000/lavoie-oais.html Brian Lavoie: Meeting the challenges of digital preservation: The OAIS reference model]&lt;br /&gt;
* [http://www.dpconline.org/docman/technology-watch-reports/1359-dpctw14-02/file Brian Lavoie: The Open Archival Information System \(OAIS\) Reference Model: Introductory Guide]&lt;br /&gt;
&lt;br /&gt;
[[Category:FOGALMAK]]&lt;br /&gt;
&lt;br /&gt;
[[Category:SZABVÁNYOK]]&lt;/div&gt;</summary>
		<author><name>Gyula</name></author>
		
	</entry>
	<entry>
		<id>https://webarchivum.oszk.hu/mediawiki/index.php?title=PREMIS&amp;diff=1698</id>
		<title>PREMIS</title>
		<link rel="alternate" type="text/html" href="https://webarchivum.oszk.hu/mediawiki/index.php?title=PREMIS&amp;diff=1698"/>
		<updated>2022-12-02T14:13:10Z</updated>

		<summary type="html">&lt;p&gt;Gyula: Átraktam a szervezetek helyett a szabványok kategóriába.&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= (PREservation Metadata Implementation Strategies) =&lt;br /&gt;
&lt;br /&gt;
2003-ban az OCLC (Online Computer Library Center) és az RLG (Research Libraries Group) által életre hívott munkacsoport a hosszú távú digitális megőrzéshez használandó metaadatok körének definiálása, valamint útmutatók ill. ajánlások kidolgozása céljából. 2005-ben megjelentették az első változatát a Dictionary for Preservation Metadata című jelentésüknek, mely egy átfogó (237 oldalas) kézikönyv a témában és az [[OAIS]] modell részletes kidolgozásának tekinthető a metaadatok terén. Az utolsó verzió 2015 júniusában jelent meg. Öt fő elemkategóriát tartalmaz: intellectual (a bibliográfiai leíró adatok), object (a fájlok/bitsorozatok jellemzői), events és agents (az objektummal történt események, illetve a hozzá kapcsolódó személyek/szervezetek/szoftverek adatai), valamint rights (az objektummal és annak használatával/másolásával/migrálásával stb. kapcsolatos jogok, előírások). A PREMIS Data Dictionary-ban megfogalmazott ajánlásokat és a hozzá mellékelt XML sémát számos digitális gyűjteményben (pl. webarchívumban) és szoftverben/rendszerben alkalmazzák a megőrzéssel kapcsolatos metaadatokhoz.&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
&lt;br /&gt;
* [https://en.wikipedia.org/wiki/Preservation_Metadata:_Implementation_Strategies Wikipedia: Preservation Metadata: Implementation Strategies]&lt;br /&gt;
* [http://www.oclc.org/research/activities/pmwg.html A PREMIS weboldala az OCLC honlapján]&lt;br /&gt;
* [http://www.loc.gov/standards/premis/ A PREMIS weboldala a Library of Congress honlapján]&lt;br /&gt;
* [http://digitalcommons.unl.edu/cgi/viewcontent.cgi?article=2755&amp;amp;context=libphilprac Laurentia Romaniuk: Metadata for a Web Archive: PREMIS and XMP as Tools for the Task]&lt;br /&gt;
&lt;br /&gt;
[[Category:SZABVÁNYOK]]&lt;/div&gt;</summary>
		<author><name>Gyula</name></author>
		
	</entry>
	<entry>
		<id>https://webarchivum.oszk.hu/mediawiki/index.php?title=PREMIS&amp;diff=1697</id>
		<title>PREMIS</title>
		<link rel="alternate" type="text/html" href="https://webarchivum.oszk.hu/mediawiki/index.php?title=PREMIS&amp;diff=1697"/>
		<updated>2022-12-02T14:12:29Z</updated>

		<summary type="html">&lt;p&gt;Gyula: Elütések javítása&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= (PREservation Metadata Implementation Strategies) =&lt;br /&gt;
&lt;br /&gt;
2003-ban az OCLC (Online Computer Library Center) és az RLG (Research Libraries Group) által életre hívott munkacsoport a hosszú távú digitális megőrzéshez használandó metaadatok körének definiálása, valamint útmutatók ill. ajánlások kidolgozása céljából. 2005-ben megjelentették az első változatát a Dictionary for Preservation Metadata című jelentésüknek, mely egy átfogó (237 oldalas) kézikönyv a témában és az [[OAIS]] modell részletes kidolgozásának tekinthető a metaadatok terén. Az utolsó verzió 2015 júniusában jelent meg. Öt fő elemkategóriát tartalmaz: intellectual (a bibliográfiai leíró adatok), object (a fájlok/bitsorozatok jellemzői), events és agents (az objektummal történt események, illetve a hozzá kapcsolódó személyek/szervezetek/szoftverek adatai), valamint rights (az objektummal és annak használatával/másolásával/migrálásával stb. kapcsolatos jogok, előírások). A PREMIS Data Dictionary-ban megfogalmazott ajánlásokat és a hozzá mellékelt XML sémát számos digitális gyűjteményben (pl. webarchívumban) és szoftverben/rendszerben alkalmazzák a megőrzéssel kapcsolatos metaadatokhoz.&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
&lt;br /&gt;
* [https://en.wikipedia.org/wiki/Preservation_Metadata:_Implementation_Strategies Wikipedia: Preservation Metadata: Implementation Strategies]&lt;br /&gt;
* [http://www.oclc.org/research/activities/pmwg.html A PREMIS weboldala az OCLC honlapján]&lt;br /&gt;
* [http://www.loc.gov/standards/premis/ A PREMIS weboldala a Library of Congress honlapján]&lt;br /&gt;
* [http://digitalcommons.unl.edu/cgi/viewcontent.cgi?article=2755&amp;amp;context=libphilprac Laurentia Romaniuk: Metadata for a Web Archive: PREMIS and XMP as Tools for the Task]&lt;br /&gt;
&lt;br /&gt;
[[Category:SZERVEZETEK]]&lt;/div&gt;</summary>
		<author><name>Gyula</name></author>
		
	</entry>
	<entry>
		<id>https://webarchivum.oszk.hu/mediawiki/index.php?title=CDXJ&amp;diff=1694</id>
		<title>CDXJ</title>
		<link rel="alternate" type="text/html" href="https://webarchivum.oszk.hu/mediawiki/index.php?title=CDXJ&amp;diff=1694"/>
		<updated>2022-11-10T13:20:07Z</updated>

		<summary type="html">&lt;p&gt;Gyula: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;&lt;br /&gt;
Az [[OpenWayback]] 3.0-ás verziójában bevezetett indexfájl formátum, [[WARC]] és [[ARC]] fájlok kereshetővé tétele céljából. A [[CDX]] formátum egy továbbfejlesztése, amely egyrészt leegyszerűsíti az elsődleges mezőnevek körét, másrészt lehetővé teszi egy JSON blokk hozzáadását minden rekordhoz, amivel további plusz adatok tárolhatók és kereshetők vissza.&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
&lt;br /&gt;
* [https://pywb.readthedocs.io/en/latest/manual/indexing.html Az indexelésről és a CDXJ formátumról a PyWB oldalán]&lt;br /&gt;
&lt;br /&gt;
[[Category:FORMÁTUMOK]]&lt;/div&gt;</summary>
		<author><name>Gyula</name></author>
		
	</entry>
	<entry>
		<id>https://webarchivum.oszk.hu/mediawiki/index.php?title=CDXJ&amp;diff=1693</id>
		<title>CDXJ</title>
		<link rel="alternate" type="text/html" href="https://webarchivum.oszk.hu/mediawiki/index.php?title=CDXJ&amp;diff=1693"/>
		<updated>2022-11-10T13:19:43Z</updated>

		<summary type="html">&lt;p&gt;Gyula: A halott linket lecseréltem egy újabbra.&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;&lt;br /&gt;
Az [[OpenWayback]] 3.0-ás verziójában bevezetett indexfájl formátum, [[WARC]] és [[ARC]] fájlok kereshetővé tétele céljából. A [[CDX]] formátum egy továbbfejlesztése, amely egyrészt leegyszerűsíti az elsődleges mezőnevek körét, másrészt lehetővé teszi egy JSON blokk hozzáadását minden rekordhoz, amivel további plusz adatok tárolhatók és kereshetők vissza.&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
&lt;br /&gt;
* [https://pywb.readthedocs.io/en/latest/manual/indexing.html Az indexelésről a PyWB oldalán]&lt;br /&gt;
&lt;br /&gt;
[[Category:FORMÁTUMOK]]&lt;/div&gt;</summary>
		<author><name>Gyula</name></author>
		
	</entry>
</feed>