https://webarchivum.oszk.hu/mediawiki/api.php?action=feedcontributions&user=Admin&feedformat=atomMIA - Szerkesztő közreműködései [hu]2024-03-29T11:30:54ZSzerkesztő közreműködéseiMediaWiki 1.31.16https://webarchivum.oszk.hu/mediawiki/index.php?title=Conifer&diff=1805Conifer2024-02-02T08:42:09Z<p>Admin: </p>
<hr />
<div>A [[Webrecorder]] online változatának, a korábban a webrecorder.io címen elérhető felhőszolgáltatásnak 2020-ban megújult változata.<br />
<br />
----<br />
<br />
* [https://conifer.rhizome.org/ A Conifer felhőszolgáltatás honlapja]<br />
* [https://github.com/Rhizome-Conifer/conifer A Conifer a GitHub-on]<br />
<br />
[[Category:SZOLGÁLTATÁSOK]]</div>Adminhttps://webarchivum.oszk.hu/mediawiki/index.php?title=Scrapy&diff=1804Scrapy2024-01-09T12:27:59Z<p>Admin: </p>
<hr />
<div>Pythonban írt open source web crawling keretrendszer, első változata 2008-ban jelent meg. Eredetileg keresőrendszerekhez szánták, de alkalmas arra is, hogy weboldalakból strukturált adatokat gyűjtsön ki, de általános célú [[crawler]]ként is használható (pl. webarchiváláshoz), illetve webmesterek tesztelhetik is vele, hogy a webhelyüket hogyan tudják bejárni a robotok. Jelenleg a [[Scrapinghub]] gondozza a projektet. <br />
<br />
----<br />
<br />
* [https://hu.wikipedia.org/wiki/Scrapy Wikipédia: Scrapy]<br />
* [https://scrapy.org A Scrapy honlapja]<br />
* [https://github.com/scrapy/scrapy A Scrapy a GiHub-on]<br />
<br />
[[Category:SZOFTVEREK]]</div>Adminhttps://webarchivum.oszk.hu/mediawiki/index.php?title=Scrapy_Warcio&diff=1798Scrapy Warcio2023-08-09T07:02:01Z<p>Admin: </p>
<hr />
<div>Az [[Internet Archive]] által 2019-ben Python-ban írt open source program, amivel [[WARC]] formátumra lehet konvertálni a [[Scrapy]]-vel gyűjtött fájlokat. <br />
<br />
----<br />
<br />
* [https://github.com/internetarchive/scrapy-warcio A Scrapy Warcio a GitHub-on]<br />
<br />
[[Category:SZOFTVEREK]]</div>Adminhttps://webarchivum.oszk.hu/mediawiki/index.php?title=Scrapy_Warcio&diff=1797Scrapy Warcio2023-08-09T07:01:48Z<p>Admin: Új oldal, tartalma: „Az Internet Archive által 2019-ben Python-ban írt open source program, amivel WARC formátumra lehet konvertálni a Scrapy-vel gyűjtött fájlokat. ---…”</p>
<hr />
<div>Az [[Internet Archive]] által 2019-ben Python-ban írt open source program, amivel [[WARC]] formátumra lehet konvertálni a [[Scrapy]]-vel gyűjtött fájlokat. <br />
<br />
----<br />
<br />
* [https://github.com/internetarchive/scrapy-warcio Scrapy Warcio a GitHub-on]<br />
<br />
[[Category:SZOFTVEREK]]</div>Adminhttps://webarchivum.oszk.hu/mediawiki/index.php?title=WARCreate&diff=1796WARCreate2023-08-08T11:46:16Z<p>Admin: </p>
<hr />
<div>A Chrome böngészőhöz készült kiegészítő, amivel az éppen nézett weboldal elmenthető egy szabványos [[WARC]] fájlként. Integrálható a [[WAIL]] keretrendszerrel is.<br />
<br />
----<br />
<br />
* [http://warcreate.com A WARCreate weblapja]<br />
* [https://chrome.google.com/webstore/detail/warcreate/kenncghfghgolcbmckhiljgaabnpcaaa A letölthető WARCreate plug-in]<br />
* [http://github.com/machawk1/warcreate/ A WARCreate a GitHub-on]<br />
* [https://digitalcommons.odu.edu/cgi/viewcontent.cgi?article=1154&context=computerscience_fac_pubs Mat Kelly - Michele C. Weigle: WARCreate: Create Wayback-consumable WARC files from any webpage]<br />
<br />
[[Category:SZOFTVEREK]]</div>Adminhttps://webarchivum.oszk.hu/mediawiki/index.php?title=WARCreate&diff=1795WARCreate2023-08-08T11:45:31Z<p>Admin: </p>
<hr />
<div>A Chrome böngészőhöz készült kiegészítő, amivel az éppen nézett weboldal elmenthető egy szabványos [[WARC]] fájlként. Integrálható a [[WAIL]] keretrendszerrel is.<br />
<br />
----<br />
<br />
* [http://warcreate.com A WARCreate weblapja]<br />
* [https://chrome.google.com/webstore/detail/warcreate/kenncghfghgolcbmckhiljgaabnpcaaa A letölthető WARCreate plug-in]<br />
* [http://github.com/machawk1/warcreate/ A WARCreate a GitHub-on]<br />
* [https://digitalcommons.odu.edu/cgi/viewcontent.cgi?article=1154&context=computerscience_fac_pubs Mat Kelly - Michele C. Weigle: WARCreate: Create Wayback-Consumable WARC Files From Any Webpage]<br />
<br />
[[Category:SZOFTVEREK]]</div>Adminhttps://webarchivum.oszk.hu/mediawiki/index.php?title=WARCreate&diff=1794WARCreate2023-08-08T11:44:41Z<p>Admin: </p>
<hr />
<div>A Chrome böngészőhöz készült kiegészítő, amivel az éppen nézett weboldal elmenthető egy szabványos [[WARC]] fájlként. Integrálható a [[WAIL]] keretrendszerrel is.<br />
<br />
----<br />
<br />
* [http://warcreate.com A WARCreate weblapja]<br />
* [https://chrome.google.com/webstore/detail/warcreate/kenncghfghgolcbmckhiljgaabnpcaaa A letölthető WARCreate plug-in]<br />
* [http://github.com/machawk1/warcreate/ A WARCreate a GitHub-on]<br />
* [https://digitalcommons.odu.edu/cgi/viewcontent.cgi?article=1154&context=computerscience_fac_pubs Mat Kelly - Michele C. Weigle: WARCreate: Cr eate: Create Wayback-Consumable W yback-Consumable WARC Files F ARC Files From Any<br />
Webpage]<br />
<br />
[[Category:SZOFTVEREK]]</div>Adminhttps://webarchivum.oszk.hu/mediawiki/index.php?title=Archive_of_Tomorrow&diff=1793Archive of Tomorrow2023-08-07T12:03:19Z<p>Admin: </p>
<hr />
<div>2022 februárjában a National Library of Scotland irányításával indított 14 hónapos futamidejű projekt, melyben a British Library mellett több brit egyetemi könyvtár is részt vesz. A projektben 10 ezer egészségügyi témájú webhelyet archiválnak az [[UKWA (brit)|UKWA]]-ban és egy részgyűjteményt alakítanak ki belőlük "Talking about Health" néven. Az anyagot a Covid-19 járvánnyal kapcsolatos hírek és álhírek, nézőpontok és viták kutatása mellett egyéb betegségek internetes lenyomatainak elemzésére is alkalmassá teszik. <br />
<br />
----<br />
<br />
* [https://www.nls.uk/about-us/working-with-others/archive-of-tomorrow/ A projekt weboldala a National Library of Scotland honlapján]<br />
* [https://www.lib.cam.ac.uk/archiveoftomorrow A projekt weboldala a Cambridge University Library honlapján]<br />
* [https://data.nls.uk/data/metadata-collections/archive-of-tomorrow-project/ A nyilvánosan letölthető adathalmazok]<br />
* [https://netpreserveblog.wordpress.com/2022/04/21/archive-of-tomorrow-capturing-online-health-misinformation/ Alice Austin: Archive of Tomorrow – Capturing online health (mis)information]<br />
* [https://www.youtube.com/watch?v=aPP6pz4q9CQ Leontien Talboom - Mark Simon Haydn: ‘Research-ready’ collections]<br />
<br />
[[Category:PROJEKTEK]]</div>Adminhttps://webarchivum.oszk.hu/mediawiki/index.php?title=ResPaDon&diff=1792ResPaDon2023-08-07T12:01:55Z<p>Admin: </p>
<hr />
<div>= (Réseau de Partenaires pour l'analyse et l'exploration de données numériques) =<br />
<br />
A Lille-i Egyetem, valamint a Francia Nemzeti Könyvtár által vezetett és több kutatóintézet részvételével 2021 és 2023 között zajló projekt, melynek célja a nemzeti webarchívum kutatási célú hasznosításának elősegítése. A projekt keretében konferenciákat és workshopokat tartanak, szakmai gyakorlatokat hirdetnek, publikációkat írnak stb. Négy munkacsoportot alakítottak ki: 1. Stratégiai kérdések és ajánlások, 2. A webarchívumok hasznosítási lehetőségeinek feltárása, 3. Távoli hozzáférést biztosító "kutatói kapszula" kialakítása, 4. Korpuszok kialakítása és elemzése archivált webtartalmakból, összevetve az élő webes korpuszoknál használt megoldásokkal.<br />
<br />
----<br />
<br />
* [https://respadon.hypotheses.org/ A ResPaDon projekt honlapja]<br />
* [https://respadon.medialab.sciencespo.fr/ Mélanie Leroy-Terquem: Explorer les archives du web avec Hyphe]<br />
* [https://www.youtube.com/watch?v=bTt9H3S2qXg Jennifer Morival - Dorothée Benhamou-Suesser: ResPaDon: Expanding research use of french web archives]<br />
* [https://www.youtube.com/watch?v=gw5h-QmmBiM Jennifer Morival - Sara Aubry - Dorothée Benhamou-Suesser: Developing new academic uses of web archives collections]<br />
<br />
[[Category:PROJEKTEK]]</div>Adminhttps://webarchivum.oszk.hu/mediawiki/index.php?title=ResPaDon&diff=1791ResPaDon2023-08-07T12:01:22Z<p>Admin: </p>
<hr />
<div>= (Réseau de Partenaires pour l'analyse et l'exploration de données numériques) =<br />
<br />
A Lille-i Egyetem, valamint a Francia Nemzeti Könyvtár által vezetett és több kutatóintézet részvételével 2021 és 2023 között zajló projekt, melynek célja a nemzeti webarchívum kutatási célú hasznosításának elősegítése. A projekt keretében konferenciákat és workshopokat tartanak, szakmai gyakorlatokat hirdetnek, publikációkat írnak stb. Négy munkacsoportot alakítottak ki: 1. Stratégiai kérdések és ajánlások, 2. A webarchívumok hasznosítási lehetőségeinek feltárása, 3. Távoli hozzáférést biztosító "kutatói kapszula" kialakítása, 4. Korpuszok kialakítása és elemzése archivált webtartalmakból, összevetve az élő webes korpuszoknál használt megoldásokkal.<br />
<br />
----<br />
<br />
* [https://respadon.hypotheses.org/ A ResPaDon projekt honlapja]<br />
* [https://respadon.medialab.sciencespo.fr/ Explorer les archives du web avec Hyphe]<br />
* [https://www.youtube.com/watch?v=bTt9H3S2qXg Jennifer Morival - Dorothée Benhamou-Suesser: ResPaDon: Expanding research use of french web archives]<br />
* [https://www.youtube.com/watch?v=gw5h-QmmBiM Jennifer Morival - Sara Aubry - Dorothée Benhamou-Suesser: Developing new academic uses of web archives collections]<br />
<br />
[[Category:PROJEKTEK]]</div>Adminhttps://webarchivum.oszk.hu/mediawiki/index.php?title=ResPaDon&diff=1790ResPaDon2023-08-07T11:59:58Z<p>Admin: </p>
<hr />
<div>= (Réseau de Partenaires pour l'analyse et l'exploration de données numériques) =<br />
<br />
A Lille-i Egyetem, valamint a Francia Nemzeti Könyvtár által vezetett és több kutatóintézet részvételével 2021 és 2023 között zajló projekt, melynek célja a nemzeti webarchívum kutatási célú hasznosításának elősegítése. A projekt keretében konferenciákat és workshopokat tartanak, szakmai gyakorlatokat hirdetnek, publikációkat írnak stb. Négy munkacsoportot alakítottak ki: 1. Stratégiai kérdések és ajánlások, 2. A webarchívumok hasznosítási lehetőségeinek feltárása, 3. Távoli hozzáférést biztosító "kutatói kapszula" kialakítása, 4. Korpuszok kialakítása és elemzése archivált webtartalmakból, összevetve az élő webes korpuszoknál használt megoldásokkal.<br />
<br />
----<br />
<br />
* [https://respadon.hypotheses.org/ A ResPaDon projekt honlapja]<br />
* [https://respadon.medialab.sciencespo.fr/ Explorer les archives du web avec Hyphe]<br />
* [https://www.youtube.com/watch?v=bTt9H3S2qXg ResPaDon: Expanding research use of french web archives]<br />
* [https://www.youtube.com/watch?v=gw5h-QmmBiM Jennifer Morival - Sara Aubry - Dorothée Benhamou-Suesser: Developing new academic uses of web archives collections]<br />
<br />
[[Category:PROJEKTEK]]</div>Adminhttps://webarchivum.oszk.hu/mediawiki/index.php?title=NUAWEB_(brazil)&diff=1789NUAWEB (brazil)2023-08-07T11:32:41Z<p>Admin: </p>
<hr />
<div>= (Núcleo de Pesquisa em Arquivamento da Web e Preservação Digital) =<br />
<br />
A brazil Universidade Federal do Rio Grande do Sul egyetemen 2017-ben indult webarchiváló projekt, melynek több alprojektje is van: 1. Megőrzési irányelvek és technológiai modellek, 2. A 2018/2018-as brazil választások internetes anyagának archiválása (AWEB), 3. COVID-19 Brazíliában – webes archiválás és digitális megőrzés, 4. Az éghajlatváltozás webes információforrásainak digitális megőrzése.<br />
<br />
----<br />
<br />
* [https://www.ufrgs.br/nuaweb/ A NUAWEB weboldala az egyetem honlapján]<br />
* [https://arquivo.ong.br/ Arquivo.ong.br: community of practices in web archives]<br />
* [https://books.google.hu/books?id=5VIzEAAAQBAJ&pg=PA82#v=onepage&q&f=false Jonas Ferrigolo Melo - Moisés Rockembach: International Initiatives and Advances in Brazil for Government Web Archiving]<br />
* [https://www.youtube.com/watch?v=RM4MbNZrXPA Jonas Ferrigolo Melo - Moisés Rockembach: Public policies for governmental web archiving in Brazil]<br />
<br />
[[Category:PROJEKTEK]]<br />
[[Category:NEMZETI PROJEKTEK]]</div>Adminhttps://webarchivum.oszk.hu/mediawiki/index.php?title=NUAWEB_(brazil)&diff=1788NUAWEB (brazil)2023-08-07T11:08:28Z<p>Admin: </p>
<hr />
<div>= (Núcleo de Pesquisa em Arquivamento da Web e Preservação Digital) =<br />
<br />
Universidade Federal do Rio Grande do Sul<br />
<br />
The Research Nucleus on Web Archiving and Digital Preservation was created in 2017 with the objective of investigating characteristics of web archiving through national and international initiatives, dealing with both the policies and the technologies involved in the process. It studies aspects related to the preservation, use and access over time of digital objects made available on the web retrospectively and as digital memory (website, sound, image, video, database, data from social networks, among others), with contributions Archivology, Librarianship, Information Science, Communication and Computer Science.<br />
<br />
Research Project Brazilian web archiving: preservation policies and technological models<br />
Publications about the research<br />
<br />
AWEB Research Project – Web Archiving of the 2018 / 2018 Brazilian Elections Brazilian Elections Web Archiving (Federal University of Rio Grande do Sul and University of Porto)<br />
Publications about the research<br />
<br />
COVID-19 Research Project in Brazil – Web Archiving and Digital Preservation / COVID-19 in Brazil – Web Archiving and Digital Preservation (Federal University of Rio Grande do Sul)<br />
Collaboration in web content capture<br />
<br />
<br />
Research project Digital Preservation of Climate Change on the web<br />
Access the project page<br />
<br />
<br />
----<br />
<br />
* [https://www.ufrgs.br/nuaweb/ A NUAWEB weboldala az egyetem honlapján]<br />
* [https://arquivo.ong.br/ Arquivo.ong.br: community of practices in web archives]<br />
* [https://books.google.hu/books?id=5VIzEAAAQBAJ&pg=PA82#v=onepage&q&f=false Jonas Ferrigolo Melo - Moisés Rockembach: International Initiatives and Advances in Brazil for Government Web Archiving]<br />
* [https://www.youtube.com/watch?v=RM4MbNZrXPA Jonas Ferrigolo Melo - Moisés Rockembach: Public policies for governmental web archiving in Brazil]<br />
<br />
[[Category:PROJEKTEK]]<br />
[[Category:NEMZETI PROJEKTEK]]</div>Adminhttps://webarchivum.oszk.hu/mediawiki/index.php?title=NUAWEB_(brazil)&diff=1787NUAWEB (brazil)2023-08-07T11:07:35Z<p>Admin: </p>
<hr />
<div>= (Núcleo de Pesquisa em Arquivamento da Web e Preservação Digital) =<br />
<br />
Universidade Federal do Rio Grande do Sul<br />
<br />
The Research Nucleus on Web Archiving and Digital Preservation was created in 2017 with the objective of investigating characteristics of web archiving through national and international initiatives, dealing with both the policies and the technologies involved in the process. It studies aspects related to the preservation, use and access over time of digital objects made available on the web retrospectively and as digital memory (website, sound, image, video, database, data from social networks, among others), with contributions Archivology, Librarianship, Information Science, Communication and Computer Science.<br />
<br />
Research Project Brazilian web archiving: preservation policies and technological models<br />
Publications about the research<br />
<br />
AWEB Research Project – Web Archiving of the 2018 / 2018 Brazilian Elections Brazilian Elections Web Archiving (Federal University of Rio Grande do Sul and University of Porto)<br />
Publications about the research<br />
<br />
COVID-19 Research Project in Brazil – Web Archiving and Digital Preservation / COVID-19 in Brazil – Web Archiving and Digital Preservation (Federal University of Rio Grande do Sul)<br />
Collaboration in web content capture<br />
<br />
<br />
Research project Digital Preservation of Climate Change on the web<br />
Access the project page<br />
<br />
<br />
----<br />
<br />
* [http://www.ifs.tuwien.ac.at/~aola/ A NUAWEB weboldala az egyetem honlapján]<br />
* [https://arquivo.ong.br/ Arquivo.ong.br: community of practices in web archives]<br />
* [https://books.google.hu/books?id=5VIzEAAAQBAJ&pg=PA82#v=onepage&q&f=false Jonas Ferrigolo Melo - Moisés Rockembach: International Initiatives and Advances in Brazil for Government Web Archiving]<br />
* [https://www.youtube.com/watch?v=RM4MbNZrXPA Jonas Ferrigolo Melo - Moisés Rockembach: Public policies for governmental web archiving in Brazil]<br />
<br />
[[Category:PROJEKTEK]]<br />
[[Category:NEMZETI PROJEKTEK]]</div>Adminhttps://webarchivum.oszk.hu/mediawiki/index.php?title=NUAWEB_(brazil)&diff=1786NUAWEB (brazil)2023-08-07T10:45:30Z<p>Admin: Új oldal, tartalma: „= (Núcleo de Pesquisa em Arquivamento da Web e Preservação Digital) = Universidade Federal do Rio Grande do Sul Research Project Brazilian web archiving: preserv…”</p>
<hr />
<div>= (Núcleo de Pesquisa em Arquivamento da Web e Preservação Digital) =<br />
<br />
Universidade Federal do Rio Grande do Sul<br />
<br />
<br />
Research Project Brazilian web archiving: preservation policies and technological models<br />
Publications about the research<br />
<br />
AWEB Research Project – Web Archiving of the 2018 / 2018 Brazilian Elections Brazilian Elections Web Archiving (Federal University of Rio Grande do Sul and University of Porto)<br />
Publications about the research<br />
<br />
<br />
<br />
COVID-19 Research Project in Brazil – Web Archiving and Digital Preservation / COVID-19 in Brazil – Web Archiving and Digital Preservation (Federal University of Rio Grande do Sul)<br />
Collaboration in web content capture<br />
<br />
<br />
<br />
Research project Digital Preservation of Climate Change on the web<br />
Access the project page<br />
<br />
<br />
----<br />
<br />
* [http://www.ifs.tuwien.ac.at/~aola/ A NUAWEB weboldala az egyetem honlapján]<br />
* [https://arquivo.ong.br/ Arquivo.ong.br: community of practices in web archives]<br />
* [https://www.youtube.com/watch?v=RM4MbNZrXPA Jonas Ferrigolo Melo - Moisés Rockembach: Public policies for governmental web archiving in Brazil]<br />
<br />
[[Category:PROJEKTEK]]<br />
[[Category:NEMZETI PROJEKTEK]]</div>Adminhttps://webarchivum.oszk.hu/mediawiki/index.php?title=Memory_in_Uncertainty&diff=1785Memory in Uncertainty2023-08-07T09:23:28Z<p>Admin: </p>
<hr />
<div>A 2020-ban alapított, berlini székhelyű New Design Congress szervezet kutatási projektje az aktuális webarchiválási technológiákról és azok társadalmi-politikai hatásairól. A [[Webrecorder]] fejlesztőivel együttműködve 2022 novemberében tették közzé azt a jelentést, mely ennek a szakterületnek a kihívásait, veszélyeit és lehetőségeit foglalja össze.<br />
<br />
----<br />
<br />
* [https://members.newdesigncongress.org/memory-in-uncertainty-web-preservation-in-the-polycrisis/ A projekt eredményeit összefoglaló jelentés a New Design Congress honlapján]<br />
* [https://www.youtube.com/watch?v=TdiQGXSZmCk Cade Diehm: Memory in Uncertainty: IPFS and digital preservation in the multi-crisis present]<br />
* [https://www.youtube.com/watch?v=TdiQGXSZmCk Cade Diehm - Benjamin Royer: Memory in Uncertainty]<br />
<br />
[[Category:PROJEKTEK]]</div>Adminhttps://webarchivum.oszk.hu/mediawiki/index.php?title=Memory_in_Uncertainty&diff=1784Memory in Uncertainty2023-08-07T09:23:04Z<p>Admin: Új oldal, tartalma: „A 2020-ban alapított, berlini székhelyű New Design Congress szervezet kutatási projektje az aktuális webarchiválási technológiákról és azok társadalmi-polit…”</p>
<hr />
<div>A 2020-ban alapított, berlini székhelyű New Design Congress szervezet kutatási projektje az aktuális webarchiválási technológiákról és azok társadalmi-politikai hatásairól. A [[Webrecorder]] project fejlesztőivel együttműködve 2022 novemberében tették közzé azt a jelentést, mely ennek a szakterületnek a kihívásait, veszélyeit és lehetőségeit foglalja össze.<br />
<br />
----<br />
<br />
* [https://members.newdesigncongress.org/memory-in-uncertainty-web-preservation-in-the-polycrisis/ A projekt eredményeit összefoglaló jelentés a New Design Congress honlapján]<br />
* [https://www.youtube.com/watch?v=TdiQGXSZmCk Cade Diehm: Memory in Uncertainty: IPFS and digital preservation in the multi-crisis present]<br />
* [https://www.youtube.com/watch?v=TdiQGXSZmCk Cade Diehm - Benjamin Royer: Memory in Uncertainty]<br />
<br />
[[Category:PROJEKTEK]]</div>Adminhttps://webarchivum.oszk.hu/mediawiki/index.php?title=Archive_of_Tomorrow&diff=1783Archive of Tomorrow2023-08-07T09:01:19Z<p>Admin: </p>
<hr />
<div>2022 februárjában a National Library of Scotland irányításával indított 14 hónapos futamidejű projekt, melyben a British Library mellett több brit egyetemi könyvtár is részt vesz. A projektben 10 ezer egészségügyi témájú webhelyet archiválnak az [[UKWA (brit)|UKWA]]-ban és egy részgyűjteményt alakítanak ki belőlük "Talking about Health" néven. Az anyagot a Covid-19 járvánnyal kapcsolatos hírek és álhírek, nézőpontok és viták kutatása mellett egyéb betegségek internetes lenyomatainak elemzésére is alkalmassá teszik. <br />
<br />
----<br />
<br />
* [https://www.nls.uk/about-us/working-with-others/archive-of-tomorrow/ A projekt weboldala a National Library of Scotland honlapján]<br />
* [https://www.lib.cam.ac.uk/archiveoftomorrow A projekt weboldala a Cambridge University Library honlapján]<br />
* [https://data.nls.uk/data/metadata-collections/archive-of-tomorrow-project/ A nyilvánosan letölthető adathalmazok]<br />
* [https://netpreserveblog.wordpress.com/2022/04/21/archive-of-tomorrow-capturing-online-health-misinformation/ Alice Austin: Archive of Tomorrow – Capturing online health (mis)information]<br />
* [https://www.youtube.com/watch?v=aPP6pz4q9CQ ‘Research-ready’ collections]<br />
<br />
[[Category:PROJEKTEK]]</div>Adminhttps://webarchivum.oszk.hu/mediawiki/index.php?title=Archive_of_Tomorrow&diff=1782Archive of Tomorrow2023-08-07T09:00:41Z<p>Admin: Új oldal, tartalma: „2022 februárjában a National Library of Scotland irányításával indított 14 hónapos futamidejű projekt, melyben a British Library mellett több brit egyetemi k…”</p>
<hr />
<div>2022 februárjában a National Library of Scotland irányításával indított 14 hónapos futamidejű projekt, melyben a British Library mellett több brit egyetemi könyvtár is részt vesz. A projektben 10 ezer egészségügyi témájú webhelyet archiválnak az [[UKWA]]-ban és egy részgyűjteményt alakítanak ki belőlük "Talking about Health" néven. Az anyagot a Covid-19 járvánnyal kapcsolatos hírek és álhírek, nézőpontok és viták kutatása mellett egyéb betegségek internetes lenyomatainak elemzésére is alkalmassá teszik. <br />
<br />
----<br />
<br />
* [https://www.nls.uk/about-us/working-with-others/archive-of-tomorrow/ A projekt weboldala a National Library of Scotland honlapján]<br />
* [https://www.lib.cam.ac.uk/archiveoftomorrow A projekt weboldala a Cambridge University Library honlapján]<br />
* [https://data.nls.uk/data/metadata-collections/archive-of-tomorrow-project/ A nyilvánosan letölthető adathalmazok]<br />
* [https://netpreserveblog.wordpress.com/2022/04/21/archive-of-tomorrow-capturing-online-health-misinformation/ Alice Austin: Archive of Tomorrow – Capturing online health (mis)information]<br />
* [https://www.youtube.com/watch?v=aPP6pz4q9CQ ‘Research-ready’ collections]<br />
<br />
[[Category:PROJEKTEK]]</div>Adminhttps://webarchivum.oszk.hu/mediawiki/index.php?title=ResPaDon&diff=1781ResPaDon2023-08-07T08:29:46Z<p>Admin: Új oldal, tartalma: „= (Réseau de Partenaires pour l'analyse et l'exploration de données numériques) = A Lille-i Egyetem, valamint a Francia Nemzeti Könyvtár által vezetett és több…”</p>
<hr />
<div>= (Réseau de Partenaires pour l'analyse et l'exploration de données numériques) =<br />
<br />
A Lille-i Egyetem, valamint a Francia Nemzeti Könyvtár által vezetett és több kutatóintézet részvételével 2021 és 2023 között zajló projekt, melynek célja a nemzeti webarchívum kutatási célú hasznosításának elősegítése. A projekt keretében konferenciákat és workshopokat tartanak, szakmai gyakorlatokat hirdetnek, publikációkat írnak stb. Négy munkacsoportot alakítottak ki: 1. Stratégiai kérdések és ajánlások, 2. A webarchívumok hasznosítási lehetőségeinek feltárása, 3. Távoli hozzáférést biztosító "kutatói kapszula" kialakítása, 4. Korpuszok kialakítása és elemzése archivált webtartalmakból, összevetve az élő webes korpuszoknál használt megoldásokkal.<br />
<br />
----<br />
<br />
* [https://respadon.hypotheses.org/ A ResPaDon projekt honlapja]<br />
* [https://respadon.medialab.sciencespo.fr/ Explorer les archives du web avec Hyphe]<br />
* [https://www.youtube.com/watch?v=bTt9H3S2qXg ResPaDon: Expanding research use of french web archives]<br />
* [Developing new academic uses of web archives collections]<br />
<br />
[[Category:PROJEKTEK]]</div>Adminhttps://webarchivum.oszk.hu/mediawiki/index.php?title=ARCH&diff=1780ARCH2023-08-06T09:01:51Z<p>Admin: /* (Archives Research Compute Hub) */</p>
<hr />
<div>= (Archives Research Compute Hub) =<br />
<br />
Az [[Archive-It]] Research Services és [[Archives Unleashed Project]] együttműködésével 2023-ban indult szolgáltatás, mely kutatási és oktatási célokra lehetővé teszi adathalmazok generálását, letöltését, elemzését és publikálását egy integrált, felhasználóbarát webes felületen. Az [[Archive-It]] részgyűjteményei mellett az [[Internet Archive]] webarchívumának egyes részei is kutathatók, és tervben van digitalizált állományok beépítése is. Az adatelemzéshez és a vizualizációhoz például ezek az eszközök használhatók: Jupyter Notebooks, Google CoLab, Gephi és Voyant. A felhasználókat részletes dokumentációval, online oktatással, ügyfélszolgálattal és akár valós idejű technikai támogatással segítik.<br />
<br />
----<br />
<br />
* [https://webservices.archive.org/pages/arch/ Az ARCH hivatalos weboldala]<br />
* [https://archivesunleashed.org/arch/ Az ARCH weboldala az Archives Unleashed Project honlapján]<br />
* [https://arch-webservices.zendesk.com/hc/en-us ARCH Support]<br />
* [https://blog.archive.org/2023/06/26/build-access-analyze-introducing-arch-archives-research-compute-hub/ Build, Access, Analyze: Introducing ARCH (Archives Research Compute Hub)]<br />
* [https://www.youtube.com/watch?v=Ur06MWwRGxk Samantha Fritz: Through the ARCHway]<br />
<br />
[[Category:SZOLGÁLTATÁSOK]]</div>Adminhttps://webarchivum.oszk.hu/mediawiki/index.php?title=ARCH&diff=1779ARCH2023-08-06T08:43:16Z<p>Admin: Új oldal, tartalma: „= (Archives Research Compute Hub) = ---- * [https://webservices.archive.org/pages/arch/ Az ARCH hivatalos weboldala] * [https://archivesunleashed.org/arch/ Az ARCH we…”</p>
<hr />
<div>= (Archives Research Compute Hub) =<br />
<br />
----<br />
<br />
* [https://webservices.archive.org/pages/arch/ Az ARCH hivatalos weboldala]<br />
* [https://archivesunleashed.org/arch/ Az ARCH weboldala az Archives Unleashed Project honlapján]<br />
* [https://arch-webservices.zendesk.com/hc/en-us ARCH Support]<br />
* [https://blog.archive.org/2023/06/26/build-access-analyze-introducing-arch-archives-research-compute-hub/ Build, Access, Analyze: Introducing ARCH (Archives Research Compute Hub)]<br />
<br />
[[Category:SZOLGÁLTATÁSOK]]</div>Adminhttps://webarchivum.oszk.hu/mediawiki/index.php?title=Scrapy&diff=1778Scrapy2023-07-29T16:05:15Z<p>Admin: </p>
<hr />
<div>Pythonban írt open source web crawling keretrendszer, első változata 2008-ban jelent meg. Eredetileg keresőrendszerekhez szánták, de alkalmas arra is, hogy weboldalakból strukturált adatokat gyűjtsön ki, de általános célú [[crawler]]ként is használható (pl. webarchiváláshoz), illetve webmesterek tesztelhetik is vele, hogy a webhelyüket hogyan tudják bejárni a robotok. Jelenleg a [[Scrapinghub]] gondozza a projektet. <br />
<br />
----<br />
<br />
* [https://en.wikipedia.org/wiki/Scrapy Wikipedia: Scrapy]<br />
* [https://scrapy.org A Scrapy honlapja]<br />
* [https://github.com/scrapy/scrapy A Scrapy a GiHub-on]<br />
<br />
[[Category:SZOFTVEREK]]</div>Adminhttps://webarchivum.oszk.hu/mediawiki/index.php?title=Scrapy&diff=1777Scrapy2023-07-29T16:04:19Z<p>Admin: </p>
<hr />
<div>Pythonban írt open source web crawling keretrendszer, első változata 2008-ban jelent meg. Eredetileg keresőrendszerekhez szánták, de alkalmas arra is, hogy weboldalakból strukturált adatokat gyűjtsön ki, de általános célú [[crawler]]ként is használható (pl. webarchiváláshoz), illetve webmesterek tesztelhetik is vele, hogy a webhelyüket hogyan tudják bejárni a robotok. Jelenleg a [[Scrapinghub]] gondozza a projektet. <br />
<br />
----<br />
<br />
* [Wikipedia: Scrapy https://en.wikipedia.org/wiki/Scrapy]<br />
* [Scrapy honlapja https://scrapy.org]<br />
* [A Scrapy a GiHub-on https://github.com/scrapy/scrapy]<br />
<br />
[[Category:SZOFTVEREK]]</div>Adminhttps://webarchivum.oszk.hu/mediawiki/index.php?title=Jogi_nyilatkozat&diff=1776Jogi nyilatkozat2023-07-13T14:16:08Z<p>Admin: </p>
<hr />
<div>A MIA WIKI tartalma a forrásra hivatkozva - nem üzleti céllal - bárki által szabadon felhasználható.<br />
<br />
{| class="wikitable"<br />
| Szerkesztők: Drótos László - Kalcsó Gyula - Németh Márton<br />[http://www.oszk.hu OSZK] - [https://webarchivum.oszk.hu/a-projektrol/munkatarsak-es-segitok/ Digitális Filológiai és Webarchiválási Csoport]<br />Információs e-mail cím: [mailto:webarchivum@oszk.hu webarchivum@oszk.hu]<br />Projekt honlap: https://webarchivum.oszk.hu<br />Creative Commons licenc: [https://creativecommons.org/licenses/by-nc-sa/2.5/hu/ by-nc-sa/2.5] <br />
|}</div>Adminhttps://webarchivum.oszk.hu/mediawiki/index.php?title=A_MIA_WIKI-r%C5%91l&diff=1775A MIA WIKI-ről2023-07-13T14:15:41Z<p>Admin: </p>
<hr />
<div>'''''A Magyar Internet Archívumhoz készülő tudásbázis a webarchiválással kapcsolatos ismeretekről'''''<br />
<br />
{| class="wikitable"<br />
| Szerkesztők: Drótos László - Kalcsó Gyula - Németh Márton<br />[http://www.oszk.hu OSZK] - [https://webarchivum.oszk.hu/a-projektrol/munkatarsak-es-segitok/ Digitális Filológiai és Webarchiválási Csoport]<br />Információs e-mail cím: [mailto:webarchivum@oszk.hu webarchivum@oszk.hu]<br />Projekt honlap: https://webarchivum.oszk.hu<br />Creative Commons licenc: [https://creativecommons.org/licenses/by-nc-sa/2.5/hu/ by-nc-sa/2.5] <br />
|}</div>Adminhttps://webarchivum.oszk.hu/mediawiki/index.php?title=A_MIA_WIKI-r%C5%91l&diff=1774A MIA WIKI-ről2023-07-13T14:14:59Z<p>Admin: </p>
<hr />
<div>'''''A Magyar Internet Archívumhoz készülő tudásbázis a webarchiválással kapcsolatos ismeretekről'''''<br />
<br />
{| class="wikitable" style="margin-left: auto; margin-right: 0px;"<br />
| Szerkesztők: Drótos László - Kalcsó Gyula - Németh Márton<br />[http://www.oszk.hu OSZK] - [https://webarchivum.oszk.hu/a-projektrol/munkatarsak-es-segitok/ Digitális Filológiai és Webarchiválási Csoport]<br />Információs e-mail cím: [mailto:webarchivum@oszk.hu webarchivum@oszk.hu]<br />Projekt honlap: https://webarchivum.oszk.hu<br />Creative Commons licenc: [https://creativecommons.org/licenses/by-nc-sa/2.5/hu/ by-nc-sa/2.5] <br />
|}</div>Adminhttps://webarchivum.oszk.hu/mediawiki/index.php?title=MIA_WIKI&diff=1773MIA WIKI2023-07-13T14:10:33Z<p>Admin: /* A Magyar Internet Archívumhoz készülő tudásbázis */</p>
<hr />
<div>== ''A Magyar Internet Archívumhoz készülő tudásbázis '' ==<br />
<br />
----<br />
<br />
{|style="width: 55%; margin: auto;"<br />
| colspan="2" style="text-align:left; padding-left: 17pt;" | A JELENLEGI [[:Category:MIA WIKI KATEGÓRIÁK|KATEGÓRIÁK]] ÉS SZÓCIKKEIK SZÁMA:<br />
|-<br />
|<br />
* [[:Category:FOGALMAK|FOGALMAK]] / {{PAGESINCATEGORY:FOGALMAK}}<br />
* [[:Category:FORMÁTUMOK|FORMÁTUMOK]] / {{PAGESINCATEGORY:FORMÁTUMOK}}<br />
* [[:Category:FÓRUMOK|FÓRUMOK]] / {{PAGESINCATEGORY:FÓRUMOK}}<br />
* [[:Category:HASZNOSÍTÁS|HASZNOSÍTÁS]] / {{PAGESINCATEGORY:HASZNOSÍTÁS}}<br />
* [[:Category:IRODALOM|IRODALOM]] / {{PAGESINCATEGORY:IRODALOM}}<br />
* [[:Category:PROJEKTEK|PROJEKTEK]] / {{PAGESINCATEGORY:PROJEKTEK}}<br />
|<br />
* [[:Category:RENDEZVÉNYEK|RENDEZVÉNYEK]] / {{PAGESINCATEGORY:RENDEZVÉNYEK}}<br />
* [[:Category:SZABVÁNYOK|SZABVÁNYOK]] / {{PAGESINCATEGORY:SZABVÁNYOK}}<br />
* [[:Category:SZERVEZETEK|SZERVEZETEK]] / {{PAGESINCATEGORY:SZERVEZETEK}}<br />
* [[:Category:SZOFTVEREK|SZOFTVEREK]] / {{PAGESINCATEGORY:SZOFTVEREK}}<br />
* [[:Category:SZOLGÁLTATÁSOK|SZOLGÁLTATÁSOK]] / {{PAGESINCATEGORY:SZOLGÁLTATÁSOK}}<br />
* [[Speciális:Az_összes_lap_listája|''Az összes szócikk listája'']]<br />
|}<br />
[[Fájl:3D_wall.png|center]]<br />
{| class="wikitable" style="margin-left: auto; margin-right: 0px;"<br />
| Szerkesztők: Drótos László - Kalcsó Gyula - Németh Márton<br />[http://www.oszk.hu OSZK] - [https://webarchivum.oszk.hu/a-projektrol/munkatarsak-es-segitok/ Digitális Filológiai és Webarchiválási Csoport]<br />Információs e-mail cím: [mailto:webarchivum@oszk.hu webarchivum@oszk.hu]<br />Projekt honlap: https://webarchivum.oszk.hu<br />Creative Commons licenc: [https://creativecommons.org/licenses/by-nc-sa/2.5/hu/ by-nc-sa/2.5] <br />
|}</div>Adminhttps://webarchivum.oszk.hu/mediawiki/index.php?title=MIA_WIKI&diff=1772MIA WIKI2023-07-13T14:10:19Z<p>Admin: </p>
<hr />
<div>== ''A Magyar Internet Archívumhoz készülő tudásbázis '' ==<br />
<br />
----<br />
<br />
{|style="width: 55%; margin: auto;"<br />
| colspan="2" style="text-align:left; padding-left: 17pt;" | A JELENLEGI [[:Category:MIA WIKI KATEGÓRIÁK|KATEGÓRIÁK]] ÉS SZÓCIKKEIK SZÁMA:<br />
|-<br />
|<br />
* [[:Category:FOGALMAK|FOGALMAK]] / {{PAGESINCATEGORY:FOGALMAK}}<br />
* [[:Category:FORMÁTUMOK|FORMÁTUMOK]] / {{PAGESINCATEGORY:FORMÁTUMOK}}<br />
* [[:Category:FÓRUMOK|FÓRUMOK]] / {{PAGESINCATEGORY:FÓRUMOK}}<br />
* [[:Category:HASZNOSÍTÁS|HASZNOSÍTÁS]] / {{PAGESINCATEGORY:HASZNOSÍTÁS}}<br />
* [[:Category:IRODALOM|IRODALOM]] / {{PAGESINCATEGORY:IRODALOM}}<br />
* [[:Category:PROJEKTEK|PROJEKTEK]] / {{PAGESINCATEGORY:PROJEKTEK}}<br />
|<br />
* [[:Category:RENDEZVÉNYEK|RENDEZVÉNYEK]] / {{PAGESINCATEGORY:RENDEZVÉNYEK}}<br />
* [[:Category:SZABVÁNYOK|SZABVÁNYOK]] / {{PAGESINCATEGORY:SZABVÁNYOK}}<br />
* [[:Category:SZERVEZETEK|SZERVEZETEK]] / {{PAGESINCATEGORY:SZERVEZETEK}}<br />
* [[:Category:SZOFTVEREK|SZOFTVEREK]] / {{PAGESINCATEGORY:SZOFTVEREK}}<br />
* [[:Category:SZOLGÁLTATÁSOK|SZOLGÁLTATÁSOK]] / {{PAGESINCATEGORY:SZOLGÁLTATÁSOK}}<br />
* [[Speciális:Az_összes_lap_listája|''Az összes szócikk listája'']]<br />
|}<br />
[[Fájl:3D_wall.png|center]]<br />
{| class="wikitable" style="margin-left: auto; margin-right: 0px;"<br />
| Szerkesztők: Drótos László - Kalcsó Gyula - Németh Márton<br />[http://www.oszk.hu OSZK] - [https://webarchivum.oszk.hu/a-projektrol/munkatarsak-es-segitok/ Digitális Filológiai és Webarchiválási Csoport]<br />Információs e-mail cím: [mailto:webarchivum@oszk.hu webarchivum@oszk.hu]<br />Projekt honlap: https://webarchivum.oszk.hu<br /> Creative Commons licenc: [https://creativecommons.org/licenses/by-nc-sa/2.5/hu/ by-nc-sa/2.5] <br />
|}</div>Adminhttps://webarchivum.oszk.hu/mediawiki/index.php?title=Angol_nyelv%C5%B1_szakirodalom&diff=1771Angol nyelvű szakirodalom2023-07-13T12:20:32Z<p>Admin: </p>
<hr />
<div>* Web Archiving Bibliography<br />IIPC, 2009 <br />http://www.netpreserve.org/web-archiving/bibliography<br />
<br />
* Aschenbrenner, Andreas (ed.): Web Archiving - Bibliography<br />Austrian On-Line Archive, 2004<br />http://www.ifs.tuwien.ac.at/~aola/links/WebArchiving.html<br />
<br />
* Reyes Ayala, Brenda (ed.): Web Archiving Bibliography 2013<br />Denton (Texas, US) UNT Libraries, 2013<br />https://digital.library.unt.edu/ark:/67531/metadc172362/<br />
<br />
* Towards a Glossary for Web Archive Research<br />https://www.zotero.org/groups/4380600/towards_a_glossary_for_web_archive_research/library<br />
<br />
----<br />
<br />
* Crowdsourcing in Web Archiving : A report on the crowdsourcing workshop on 4 May 2012 <br />Washington : IIPC General Assembly, 2012<br />http://web.archive.org/web/20170317160013/http://www.netpreserve.org/sites/default/files/resources/CompleteCrowdsourcing.pdf<br />
<br />
* Digital Preservation Handbook<br />Digital Preservation Coalition, 2015<br />http://www.dpconline.org/handbook<br />
<br />
* Web Archiving Guidance<br />Kew, Richmond (UK) : The National Archives, 2011<br />https://nationalarchives.gov.uk/documents/information-management/web-archiving-guidance.pdf<br />
<br />
* Web Archiving in the United States - A 2017 Survey<br />NDSA, 2018<br />https://osf.io/ht6ay/<br />
<br />
* Andersen, Holly: A Website Owner's Practical Guide to the Wayback Machine<br />In: Telecommunications & High Technology Law, 2013 (11. évf.) 1. sz.<br />http://www.jthtl.org/content/articles/V11I1/JTHTLv11i1_Andersen.PDF<br />
<br />
* Brown, Adrian: Archiving Websites: A practical guide for information management professionals<br />London : Facet Publishing, 2006<br />http://www.facetpublishing.co.uk/title.php?id=045537<br />https://books.google.hu/books?id=7NYqDgAAQBAJ<br />
<br />
* Brügger, Niels: Archiving Websites : General Considerations and Strategies<br />Arhus (Denmark), Center for Internetforskning, 2005<br />http://cfi.au.dk/publications/books/<br />
<br />
* Brügger, Niels, - Ralph Schroeder (szerk.): The Web as History : Using Web Archives to Understand the Past and the Present<br />London : UCL Press, 2017<br />http://discovery.ucl.ac.uk/1542998/1/The-Web-as-History.pdf<br />
<br />
* Finnemann, Niels Ole: Web archive<br />ISKO Encyclopedia of Knowledge Organization, 2018<br />http://www.isko.org/cyclo/web_archive<br />
<br />
* Gomes, Daniel - Joao Miranda - Miguel Costa: A survey on web archiving initiatives<br />In: International Conference on Theory and Practice of Digital Libraries<br />Berlin : Springer, 2011<br />http://sobre.arquivo.pt/about-the-archive/publications-1/documents/a-survey-on-web-archiving-initiatives<br />
<br />
* Hockx-Yu, Helen: Web Archiving at National Libraries : Findings of Stakeholders' Consultation by the Internet Archive<br />San Francisco : Internet Archive, 2016<br />https://archive.org/details/InternetArchiveStakeholdersConsultationFindingsPublic<br />
<br />
* Masanes, Julien: Web Archiving<br />Berlin : Springer, 2007<br />https://books.google.hu/books?id=PB0uTeSiVowC<br />
<br />
* Mirtaheri, Seyed M. [et al.]: A Brief History of Web Crawlers<br />Proceedings of the 2013 Conference of the Center for Advanced Studies on Collaborative Research. <br />IBM Corp., 2013.<br />https://arxiv.org/pdf/1405.0749<br />
<br />
* Nielsen, Janne: Using Web Archives in Research - an Introduction<br />Aarhus : NetLab, 2016<br />http://www.netlab.dk/wp-content/uploads/2016/10/Nielsen_Using_Web_Archives_in_Research.pdf<br />
<br />
* Niu, Jinfang: An Overview of Web Archiving<br />In: D-Lib Magazine, 2012 (18, évf.) 3/4, sz. <br />http://dlib.org/dlib/march12/niu/03niu1.html<br />
<br />
* Niu, Jinfang: Functionalities of Web Archives<br />In: D-Lib Magazine, 2012 (18, évf.) 3/4, sz. <br />http://www.dlib.org/dlib/march12/niu/03niu2.html<br />
<br />
* Pennock, Maureen: Web-Archiving : DPC Technology Watch Report 13-01. March 2013<br />Salisbury (UK) : Charles Beagrie, Ltd., 2013<br />http://dx.doi.org/10.7207/twr13-01<br />
<br />
* PoWR: The Preservation of Web Resources Handbook<br />London : JISC, 2008<br />http://pubs.ulcc.ac.uk/49/1/powrhandbookv1.pdf<br />
<br />
* Vlcek, Ivan: Identification and archiving of the Czech Web outside the National Domain<br />Proceedings of IWAW '08 (8th International Workshop for Web Archiving)<br />Aarhus (Denmark), 2008<br />http://iwaw.europarchive.org/08/IWAW2008-Vlcek.pdf<br /><br />
<br />
[[Category:IRODALOM]]</div>Adminhttps://webarchivum.oszk.hu/mediawiki/index.php?title=Warrick&diff=1770Warrick2023-07-13T12:04:20Z<p>Admin: </p>
<hr />
<div>Az Old Dominion University-n fejlesztett parancssoros alkalmazás, ami a nagy webes keresők cache-ben tárolt fájljaiból, valamint a [[Memento Project]]-hez csatlakozott webarchívumokban levő másolatokból megpróbálja helyreállítani egy webhely tartalmát (pl. véletlen törlés, vagy hacker-támadás után).<br />
<br />
----<br />
<br />
* [https://code.google.com/archive/p/warrick/ A Warrick weboldala]<br />
* [https://github.com/oduwsdl/warrick A Warrick a GitHub-on]<br />
* [https://iawebarchiving.wordpress.com/2007/02/22/warrick-a-tool-for-recovering-websites/ Warrick, a tool for recovering websites]<br />
* [https://sites.harding.edu/fmccown/pubs/lazyp-widm06.pdf Frank McCown <nowiki>[et al.]</nowiki>: Lazy Preservation: Reconstructing Websites by Crawling the Crawlers]<br />
* [https://sites.harding.edu/fmccown/pubs/factors-wi-jcdl07.pdf Frank McCown <nowiki>[et al.]</nowiki>: Factors Affecting Website Reconstruction from the Web Infrastructure]<br />
<br />
[[Category:SZOFTVEREK]]</div>Adminhttps://webarchivum.oszk.hu/mediawiki/index.php?title=Warrick&diff=1769Warrick2023-07-13T12:01:18Z<p>Admin: </p>
<hr />
<div>Az Old Dominion University-n fejlesztett parancssoros alkalmazás, ami a nagy webes keresők cache-ben tárolt fájljaiból, valamint a [[Memento Project]]-hez csatlakozott webarchívumokban levő másolatokból megpróbálja helyreállítani egy webhely tartalmát (pl. véletlen törlés, vagy hacker-támadás után).<br />
<br />
----<br />
<br />
* [https://code.google.com/archive/p/warrick/ A Warrick weboldala]<br />
* [https://github.com/oduwsdl/warrick A Warrick a GitHub-on]<br />
* [https://iawebarchiving.wordpress.com/2007/02/22/warrick-a-tool-for-recovering-websites/ Warrick, a tool for recovering websites]<br />
* [https://sites.harding.edu/fmccown/pubs/lazyp-widm06.pdf Frank McCown <nowiki>[et al.]</nowiki>: Lazy Preservation: Reconstructing Websites by Crawling the Crawlers]<br />
<br />
[[Category:SZOFTVEREK]]</div>Adminhttps://webarchivum.oszk.hu/mediawiki/index.php?title=Szoftvergy%C5%B1jtem%C3%A9nyek&diff=1768Szoftvergyűjtemények2023-07-13T11:57:30Z<p>Admin: </p>
<hr />
<div>* [https://www.archiveteam.org/index.php?title=Software Archiveteam : Software]<br />
* [https://github.com/iipc/awesome-web-archiving#tools--software Awesome Web Archiving - Tools & Software]<br />
* [https://coptr.digipres.org/index.php/Web COPTR - Community Owned digital Preservation Tool Registry - Web]<br />
* [https://wiki.digitalmethods.net/Dmi/ToolDatabase DMI Tools]<br />
* [http://netpreserve.org/web-archiving/tools-and-software IIPC Tools and Software]<br />
* [http://mementoweb.org/tools Memento Tools]<br />
* [http://www.netlab.dk/services/tools-and-tutorials/ NETLAB - Tools and Tutorials]<br />
* [https://sbforge.org SBForge Open Source hosting site]<br />
* [https://ils.unc.edu/callee/temp-dc-tools/web-archiving.htm) Web Archiving - Harvesting, Capture, Management, Access]<br />
* [https://github.com/ArchiveBox/ArchiveBox/wiki/Web-Archiving-Community Web Archiving Community]<br />
<br />
[[Category:SZOFTVEREK]]</div>Adminhttps://webarchivum.oszk.hu/mediawiki/index.php?title=MemGator&diff=1767MemGator2023-07-13T11:53:48Z<p>Admin: </p>
<hr />
<div>Az Old Dominion University informatikai karán működő Web Science & Digital Libraries Research Group által üzemeltetett [[Memento Project|Memento]] aggregátor és lekérdező felület, amihez egy publikus API is tartozik. 16 (nagyrészt brit és amerikai) webarchívumból lehet lekérdezéseket végezni vele, de sajnos sok közülük már nem válaszol. Lekérdezhetők egy adott URL mentési időpontjai ([[Memento TimeMap|TimeMap]]), vagy egy adott időponthoz legközelebbi mentései ([[Memento TimeGate|TimeGate]]), továbbá valós időben monitorozni lehet a szerver által kiküldött kérdésekre kapott válaszokat.<br />
<br />
----<br />
<br />
* [https://memgator.cs.odu.edu/ A MemGator honlapja]<br />
<br />
[[Category:SZOLGÁLTATÁSOK]]</div>Adminhttps://webarchivum.oszk.hu/mediawiki/index.php?title=MemGator&diff=1766MemGator2023-07-13T11:52:42Z<p>Admin: Új oldal, tartalma: „Az Old Dominion University informatikai karán működő Web Science & Digital Libraries Research Group által üzemeltetett Memento aggregátor és…”</p>
<hr />
<div>Az Old Dominion University informatikai karán működő Web Science & Digital Libraries Research Group által üzemeltetett [[Memento Project|Memento]] aggregátor és lekérdező felület, amihez egy publikus API is tartozik. 16 (nagyrészt brit és amerikai) webarchívumból lehet lekérdezéseket végezni vele, de sajnos sok közülük már nem válaszol. Lekérdezhetők egy adott URL mentési időpontjai ([[TimeMap]]), vagy egy adott időponthoz legközelebbi mentései ([[TimeGate]]), továbbá valós időben monitorozni lehet a szerver által kiküldött kérdésekre kapott válaszokat.<br />
<br />
----<br />
<br />
* [https://memgator.cs.odu.edu/ A MemGator honlapja]<br />
<br />
[[Category:SZOLGÁLTATÁSOK]]</div>Adminhttps://webarchivum.oszk.hu/mediawiki/index.php?title=Webpackage&diff=1765Webpackage2023-07-13T10:18:47Z<p>Admin: Új oldal, tartalma: „Specifikációk, ajánlások és eszközök gyűjteménye webhelyek összecsomagolásához akár hitelesített formában is. Ezek a csomagok offline is megoszthatók, i…”</p>
<hr />
<div>Specifikációk, ajánlások és eszközök gyűjteménye webhelyek összecsomagolásához akár hitelesített formában is. Ezek a csomagok offline is megoszthatók, illetve elhelyezhetők archívumokban.<br />
<br />
----<br />
<br />
* [https://github.com/WICG/webpackage A webpackage a GitHub-on]<br />
* [https://wicg.github.io/webpackage/draft-yasskin-wpack-use-cases.html J. Yasskin: Use Cases and Requirements for Web Packages]<br />
<br />
[[Category:SZOFTVEREK]]<br />
[[Category:SZABVÁNYOK]]</div>Adminhttps://webarchivum.oszk.hu/mediawiki/index.php?title=Hydrator&diff=1764Hydrator2023-07-13T09:59:51Z<p>Admin: Új oldal, tartalma: „A DocNow projekt keretében készült Electron-alapú desktop applikáció, amivel ID-k szerint lehet letölteni az egyes tweeteket és a hozzájuk tartozó metaadatoka…”</p>
<hr />
<div>A DocNow projekt keretében készült Electron-alapú desktop applikáció, amivel ID-k szerint lehet letölteni az egyes tweeteket és a hozzájuk tartozó metaadatokat, majd pedig JSON vagy CSV formátumban elmenteni őket. Mivel 2023 tavaszán a Twitter jelentősen korlátozta, majd felfüggesztette az API-n keresztül való letöltést, ezért a Hydrator-hoz 7 éven keresztül használt kulcsok sem működnek.<br />
<br />
----<br />
<br />
* [https://github.com/DocNow/hydrator/ A Hydrator a GitHub-on]<br />
* [https://towardsdatascience.com/learn-how-to-easily-hydrate-tweets-a0f393ed340e Aruna Pisharody: Learn how to easily hydrate tweets - Using the Hydrator app and twarc tool by DocNow]<br />
<br />
[[Category:SZOFTVEREK]]</div>Adminhttps://webarchivum.oszk.hu/mediawiki/index.php?title=WebArch&diff=1763WebArch2023-07-13T09:41:32Z<p>Admin: Új oldal, tartalma: „A varsói egyetem Digitális Kompetencia Központjában futó tudományos és oktatási projekt, az egyetlen lengyel intézményi kezdeményezés, ami a webarchiválás…”</p>
<hr />
<div>A varsói egyetem Digitális Kompetencia Központjában futó tudományos és oktatási projekt, az egyetlen lengyel intézményi kezdeményezés, ami a webarchiválással kapcsolatos ismeretek gyűjtésével és terjesztésével, valamint az archivált webtartalmak humán- és társadalomtudományi célú hasznosításával foglalkozik. Speciális részterületként a lengyelországi domén történetét is kutatják és dokumentálják. Az IDUB program keretében a régi (1996-2001 közötti) lengyel web adataiból készítenek egy online korpuszt és fejlesztenek hozzá kutatási eszközöket.<br />
<br />
----<br />
<br />
* [https://ckc.uw.edu.pl/webarch/ A webArch projekt weboldala]<br />
<br />
[[Category:PROJEKTEK]]</div>Adminhttps://webarchivum.oszk.hu/mediawiki/index.php?title=ASPW&diff=1762ASPW2023-07-13T07:03:25Z<p>Admin: Új oldal, tartalma: „= (Archiwum Społeczne Polskiego Webu) = A varsói egyetem informatikusa, Marcin Wilkowski által 2020-ban indított magánprojekt a lengyel web felderítése és kuta…”</p>
<hr />
<div>= (Archiwum Społeczne Polskiego Webu) =<br />
<br />
A varsói egyetem informatikusa, Marcin Wilkowski által 2020-ban indított magánprojekt a lengyel web felderítése és kutathatóvá tétele céljából. Az ASPW mögött futó rendszer a lengyel tweetekből különböző témákban kigyűjtött linkekből szabadon letölthető adatfájlokat készít, miután a [[Memento Project]] Time Travel API-jával ellenőrizte, hogy azok elérhetők-e valamelyik webarchívumban. Jogi okokból csak a tweet ID-k, a linkek, a title és egyéb metaadatok érhetők a nyilvános archívumban. A honlapon vizualizációk is találhatók, megnézhető, hogy az egyes témákban mik a legnépszerűbb lengyel domének. 2023 nyarán az adatbázis több mint 225 ezer azonosított és ellenőrzött URL-t tartalmazott, melyek 7,7 millió tweetből származtak.<br />
<br />
----<br />
<br />
* [https://aspw.pl/ Az ASPW projekt honlapja]<br />
* [https://github.com/mw0000/aspw-public-archive Az ASPW nyilvános archívuma a GitHub-on]<br />
<br />
[[Category:PROJEKTEK]]</div>Adminhttps://webarchivum.oszk.hu/mediawiki/index.php?title=Archives_Unleashed_Toolkit&diff=1761Archives Unleashed Toolkit2023-07-12T19:40:11Z<p>Admin: </p>
<hr />
<div>Az [[Archives Unleashed Project]] keretében a [[Warcbase]] folytatásaként fejlesztett open source eszközkészlet webarchívumok tartalmának elemzésére Apache Spark keretrendszeren. A Toolkit regisztrált felhasználóknak felhőszolgáltatás formájában is elérhető volt 2021 június 30-ig. Ezt követően beépült az [[Archive-It]] rendszerébe.<br />
<br />
----<br />
<br />
* [https://github.com/archivesunleashed/aut Az Archives Unleashed Toolkit a GitHub-on]<br />
* [https://web.archive.org/web/20210622102832/https://cloud.archivesunleashed.org/ Az Archives Unleashed Cloud 2021 júniusában archivált weboldala]<br />
* [https://link.springer.com/article/10.1007/s42803-020-00029-6 Nick Ruest <nowiki>[et al.]</nowiki>: From archive to analysis: accessing web archives at scale through a cloud-based interface]<br />
<br />
[[Category:SZOFTVEREK]]</div>Adminhttps://webarchivum.oszk.hu/mediawiki/index.php?title=Archives_Unleashed_Toolkit&diff=1760Archives Unleashed Toolkit2023-07-12T19:32:04Z<p>Admin: </p>
<hr />
<div>Az [[Archives Unleashed Project]] keretében a [[Warcbase]] folytatásaként fejlesztett open source eszközkészlet webarchívumok tartalmának elemzésére Apache Spark keretrendszeren.<br />
<br />
----<br />
<br />
* [https://github.com/archivesunleashed/aut Az Archives Unleashed Toolkit a GitHub-on]<br />
* [https://link.springer.com/article/10.1007/s42803-020-00029-6 Nick Ruest <nowiki>[et al.]</nowiki>: From archive to analysis: accessing web archives at scale through a cloud-based interface]<br />
<br />
[[Category:SZOFTVEREK]]</div>Adminhttps://webarchivum.oszk.hu/mediawiki/index.php?title=Batch_process_Google_Sheets_using_archive.org_services&diff=1759Batch process Google Sheets using archive.org services2023-07-12T19:05:26Z<p>Admin: </p>
<hr />
<div>Az [[Internet Archive]] szolgáltatása, melyhez egy regisztrált IA és egy Google account kell (utóbbihoz hozzáférést kell adnunk a webalkalmazás számára), majd megadható egy Google táblázat címe, aminek első oszlopában URL-ek vannak (max. 50 ezer). Ezután a következő lehetőségek közül választhatunk: a megadott URL-ekhez tartozó weboldalak archiválása a [[Save Page Now]] szolgáltatással; az URL-ek ellenőrzése a [[Wayback Machine]] API-jával, hogy van-e már róluk mentés; annak ellenőrzése, hogy az élő weben elérhetők-e az URL-ekhez tartozó oldalak. Az archiválás, illetve a lekérdezés státusza a táblázat második oszlopába kerül és a rendszer egy e-mailt is küld a feladat végeztével a Gmail címünkre. Van még egy negyedik opció is, amivel a Twitterről kiexportált bejegyzéseinket tölthetjük fel, melyeket az IA archivál és e-mailben visszaküldi az archivált tweetek, valamint a bennük szereplő külső linkek mentett verzióinak URL címeit egy urls.csv fájlban. <br />
<br />
----<br />
<br />
* [https://archive.org/services/wayback-gsheets/ A szolgáltatás weboldala az IA szerverén]<br />
<br />
[[Category:SZOLGÁLTATÁSOK]]</div>Adminhttps://webarchivum.oszk.hu/mediawiki/index.php?title=Batch_process_Google_Sheets_using_archive.org_services&diff=1758Batch process Google Sheets using archive.org services2023-07-12T19:01:51Z<p>Admin: </p>
<hr />
<div>Az [[Internet Archive]] szolgáltatása, melyhez egy regisztrált IA és egy Google account kell (utóbbihoz hozzáférést kell adnunk a webalkalmazás számára), majd megadható egy Google táblázat címe, aminek első oszlopában URL-ek vannak (max. 50 ezer). Ezután a következő lehetőségek közül választhatunk: a megadott URL-ekhez tartozó weboldalak archiválása a [[Save Page Now]] szolgáltatással; az URL-ek ellenőrzése a [[Wayback Machine]] API-jával, hogy van-e már róluk mentés; annak ellenőrzése, hogy az élő weben elérhetők-e az URL-ekhez tartozó oldalak. Az archiválás, illetve a lekérdezés státusza a táblázat második oszlopába kerül és a rendszer egy e-mailt is küld a feladat végeztével a Gmail címünkre. Van még egy negyedik opció is, amivel a Twitterről kiexportált bejegyzéseinket tölthetjük fel egy ZIP csomagban, melyeket az IA archivál és e-mailben visszaküldi az archivált tweetek, valamint a bennük szereplő külső linkek mentett verzióinak URL címeit egy urls.csv fájlban. <br />
<br />
----<br />
<br />
* [https://archive.org/services/wayback-gsheets/ A szolgáltatás weboldala az IA szerverén]<br />
<br />
[[Category:SZOLGÁLTATÁSOK]]</div>Adminhttps://webarchivum.oszk.hu/mediawiki/index.php?title=Batch_process_Google_Sheets_using_archive.org_services&diff=1757Batch process Google Sheets using archive.org services2023-07-12T19:00:45Z<p>Admin: Új oldal, tartalma: „Az Internet Archive szolgáltatása, melyhez egy regisztrált IA és egy Google account kell (utóbbihoz hozzáférést kell adnunk a webalkalmazás számára), maj…”</p>
<hr />
<div>Az [[Internet Archive]] szolgáltatása, melyhez egy regisztrált IA és egy Google account kell (utóbbihoz hozzáférést kell adnunk a webalkalmazás számára), majd megadható egy Google táblázat címe, aminek első oszlopában URL-ek vannak (max. 50 ezer). Ezután a következő lehetőségek közül választhatunk: a megadott URL-ekhez tartozó weboldalak archiválása a [[Save Page Now]] szolgáltatással; az URL-ek ellenőrzése a [[Wayback Machine]] API-jával, hogy van-e már róluk mentés; annak ellenőrzése, hogy az élő weben elérhetők-e az URL-ekhez tartozó oldalak. Az archiválás, illetve a lekérdezés státusza a táblázat második oszlopába kerül és a rendszer egy e-mailt is küld a feladat végeztével a Gmails címünkre. Van még egy negyedik opció is, amivel a Twitterről kiexportált bejegyzéseinket tölthetjük fel egy ZIP csomagban, melyeket az IA archivál és e-mailben visszaküldi az archivált tweetek, valamint a bennük szereplő külső linkek mentett verzióinak URL címeit egy urls.csv fájlban. <br />
<br />
----<br />
<br />
* [https://archive.org/services/wayback-gsheets/ A szolgáltatás weboldala az IA szerverén]<br />
<br />
[[Category:SZOLGÁLTATÁSOK]]</div>Adminhttps://webarchivum.oszk.hu/mediawiki/index.php?title=Warc2html&diff=1756Warc2html2023-07-12T16:43:12Z<p>Admin: Új oldal, tartalma: „Java-ban írt program a WARC fájlok tartalmának statikus HTML fájlokra való konvertálásához. 2021 novembere óta csak 0.1-es verzióban érhető el, ami a Ja…”</p>
<hr />
<div>Java-ban írt program a [[WARC]] fájlok tartalmának statikus HTML fájlokra való konvertálásához. 2021 novembere óta csak 0.1-es verzióban érhető el, ami a Javascriptekben levő linkeket még nem tudja relatív útvonalakká alakítani és egyéb korlátai is vannak.<br />
<br />
----<br />
<br />
* [https://github.com/webrecorder/ A warc2html a GitHub-on]<br />
<br />
[[Category:SZOFTVEREK]]</div>Adminhttps://webarchivum.oszk.hu/mediawiki/index.php?title=The_Archival_Acid_Test&diff=1755The Archival Acid Test2023-07-12T16:23:11Z<p>Admin: </p>
<hr />
<div>A Drexel University oktatója, Mat Kelly által 2014-ben készített weboldal, amivel tesztelni lehet az archiváló és megjelenítő eszközök képességeit a képek, a CSS fájlok, a Javascriptek, és a HTML5 funkciók esetében. A lementett oldalt megnyitva három "LED-sor" jelzi, hogy mely elemek működnek (kék négyzetek) és melyek vesztek el az archiválás során (piros vagy üres négyzetek). Az egyes négyzetek jelentése magán a weboldalon olvasható.<br />
<br />
----<br />
<br />
* [http://acid.matkelly.com/ The Archival Acid Test oldal]<br />
* [https://github.com/machawk1/archivalAcidTest Az oldal forrása a GitHub-on]<br />
* [https://www.researchgate.net/publication/265905798 Mat Kelly - Michael L. Nelson - Michele Weigle: The Archival Acid Test: Evaluating Archive Performance on Advanced HTML and JavaScript]<br />
<br />
[[Category:SZOLGÁLTATÁSOK]]</div>Adminhttps://webarchivum.oszk.hu/mediawiki/index.php?title=The_Archival_Acid_Test&diff=1754The Archival Acid Test2023-07-12T16:22:25Z<p>Admin: Új oldal, tartalma: „A Drexel University oktatója, Mat Kelly által 2014-ben készített weboldal, amivel tesztelni lehet az archiváló és megjelenítő eszközök képességeit a képek…”</p>
<hr />
<div>A Drexel University oktatója, Mat Kelly által 2014-ben készített weboldal, amivel tesztelni lehet az archiváló és megjelenítő eszközök képességeit a képek, a CSS fájlok, a Javascriptek, és a HTML5 funkciók terén. A lementett oldalt megnyitva három "LED-sor" jelzi, hogy mely elemek működnek (kék négyzetek) és melyek vesztek el az archiválás során (piros vagy üres négyzetek). Az egyes négyzetek jelentése magán a weboldalon olvasható.<br />
<br />
----<br />
<br />
* [http://acid.matkelly.com/ The Archival Acid Test oldal]<br />
* [https://github.com/machawk1/archivalAcidTest Az oldal forrása a GitHub-on]<br />
* [https://www.researchgate.net/publication/265905798 Mat Kelly - Michael L. Nelson - Michele Weigle: The Archival Acid Test: Evaluating Archive Performance on Advanced HTML and JavaScript]<br />
<br />
[[Category:SZOLGÁLTATÁSOK]]</div>Adminhttps://webarchivum.oszk.hu/mediawiki/index.php?title=Chronicrawl&diff=1753Chronicrawl2023-07-12T15:19:16Z<p>Admin: </p>
<hr />
<div>A Chronicrawl egy kísérleti stádiumban levő új [[crawler]], melyet az Ausztrál Nemzeti Könyvtár fejleszt elsősorban hírportálok lementéséhez. A rendszer a böngésző alapú archiválást kombinálja a hagyományosabb link feltáró módszerrel. A robot folyamatosan fut és adaptívan alkalmazkodik az egyes hírportálok oldalainak változási gyakoriságához. A fejlesztés során jelentkező legfontosabb kihívás éppen a változás mértékének és ütemének meghatározása az egyes aloldalak, illetve tartalmi egységek (rovatok) szintjén.<br />
<br />
----<br />
<br />
* [https://github.com/nla/chronicrawl A Chronicrawl a GitHub-on]<br />
<br />
[[Category:SZOFTVEREK]]</div>Adminhttps://webarchivum.oszk.hu/mediawiki/index.php?title=PWID&diff=1752PWID2023-07-12T15:08:11Z<p>Admin: </p>
<hr />
<div>= (Persistent Web IDentifier) =<br />
<br />
A Royal Danish Library által az Internet Engineering Task Force számára 2017-ben beadott tervezet, amely egy stabil azonosító bevezetését javasolja a webarchívumokban levő tartalmakhoz. A séma tartalmazza a webarchívum azonosítóját, az archivált forrás URI-ját és időbélyegét, valamint terjedelmét (pl. egy weboldal vagy annak valamely része, vagy egy webhely vagy annak egy része). Példák:<br />
<br />
<pre><br />
pwid:archive.org:2016-04-20_18.21.47Z:page:http://resaw.eu/resources/<br />
pwid:archive.org:2016-10-20_22.26.35:site:https://www.doi.org/<br />
</pre><br />
<br />
2022 novemberében az Internet Assigned Numbers Authority a PWID-et felvette a URN azonosítók hivatalos névterébe.<br />
<br />
----<br />
<br />
* [https://tools.ietf.org/html/draft-pwid-uri-specification-02 Scheme Specification for the pwid URI]<br />
* [https://www.iana.org/assignments/urn-formal/pwid A regisztrált PWID specifikáció az IANA honlapján]<br />
<br />
[[Category:SZABVÁNYOK]]</div>Adminhttps://webarchivum.oszk.hu/mediawiki/index.php?title=PWID&diff=1750PWID2023-07-12T15:05:39Z<p>Admin: Átirányítás megszüntetve. Eredeti cél: PWID URI Scheme Specification</p>
<hr />
<div>= (Persistent Web IDentifier) =<br />
<br />
A Royal Danish Library által az Internet Engineering Task Force számára 2017-ben beadott tervezet, amely egy stabil azonosító bevezetését javasolja a webarchívumokban levő tartalmakhoz. A URI séma tartalmazza a webarchívum azonosítóját, az archivált forrás URI-ját és időbélyegét, valamint a terjedelmét (pl. egy weboldal vagy annak valamely része, vagy egy webhely vagy annak egy része). Példák:<br />
<br />
<pre><br />
pwid:archive.org:2016-04-20_18.21.47Z:page:http://resaw.eu/resources/<br />
pwid:archive.org:2016-10-20_22.26.35:site:https://www.doi.org/<br />
</pre><br />
<br />
2022 novemberében az Internet Assigned Numbers Authority a PWID-et felvette a URN azonosítók hivatalos névterébe.<br />
<br />
----<br />
<br />
* [https://tools.ietf.org/html/draft-pwid-uri-specification-02 Scheme Specification for the pwid URI]<br />
* [https://www.iana.org/assignments/urn-formal/pwid A regisztrált PWID specifikáció az IANA honlapján]<br />
<br />
[[Category:SZABVÁNYOK]]</div>Admin