„Jupyter notebooks for web archives” változatai közötti eltérés
(→(GLAM Workbench - Web Archives)) |
|||
| 1. sor: | 1. sor: | ||
| − | = (GLAM Workbench |
+ | = (GLAM Workbench / Web Archives) = |
A Tim Sherratt által gondozott, a közgyűjtemények digitális szolgáltatásainak használatát oktató GLAM Workbench projekt webarchívumokkal foglalkozó fejezete. A projektet az ausztrál, a brit, az új-zélandi webarchívumok, valamint az [[Internet Archive]] gondozzák és az [[IIPC]] finanszírozza a kezdeti munkálatokat. Számítanak az IIPC Kutatási Munkacsoport tagjainak, illetve az egyes konzorciumi tagoknak a közreműködésére is. A projektben a Jupyter Notebook alkalmazásfelület segítségével olyan tananyagokat fejlesztenek, melyekkel a gyűjtemények kutatási célú felhasználásának különféle formái sajátíthatók el. Az interaktív tananyaggyűjtemény elérhető felhőszolgáltatásként többféle - publikus vagy regisztrációhoz kötött - platformon (Binder, Reclaim Cloud, Nectar Cloud), illetve Docker konténerként saját gépre is feltehető. A főbb témakörök: adattípusok ([[Memento Project|Memento protokoll]], [[Memento TimeGate|Timegate]], [[Memento TimeMap|TimeMap]], [[CDX]] API), adatkészletek létrehozása (archív URL-ek, aldomének, szövegek és prezentációk kinyerése), változások felderítése (két archivált verzió összehasonlítása, egy weboldal időbeli változása oldalképek, illetve szövegek összehasonlítása alapján, egy adott szöveg megjelenése és/vagy eltűnése egy adott weboldalon). Egy megfelelő plugin segítségével bármely más, [[Memento Project|memento]] kompatibilis, illetve [[Wayback|OWB]]-t vagy [[PyWb]]-t használó archívum is beilleszthető a tananyagokba a fejlesztő intézmények webarchívumai mellé. |
A Tim Sherratt által gondozott, a közgyűjtemények digitális szolgáltatásainak használatát oktató GLAM Workbench projekt webarchívumokkal foglalkozó fejezete. A projektet az ausztrál, a brit, az új-zélandi webarchívumok, valamint az [[Internet Archive]] gondozzák és az [[IIPC]] finanszírozza a kezdeti munkálatokat. Számítanak az IIPC Kutatási Munkacsoport tagjainak, illetve az egyes konzorciumi tagoknak a közreműködésére is. A projektben a Jupyter Notebook alkalmazásfelület segítségével olyan tananyagokat fejlesztenek, melyekkel a gyűjtemények kutatási célú felhasználásának különféle formái sajátíthatók el. Az interaktív tananyaggyűjtemény elérhető felhőszolgáltatásként többféle - publikus vagy regisztrációhoz kötött - platformon (Binder, Reclaim Cloud, Nectar Cloud), illetve Docker konténerként saját gépre is feltehető. A főbb témakörök: adattípusok ([[Memento Project|Memento protokoll]], [[Memento TimeGate|Timegate]], [[Memento TimeMap|TimeMap]], [[CDX]] API), adatkészletek létrehozása (archív URL-ek, aldomének, szövegek és prezentációk kinyerése), változások felderítése (két archivált verzió összehasonlítása, egy weboldal időbeli változása oldalképek, illetve szövegek összehasonlítása alapján, egy adott szöveg megjelenése és/vagy eltűnése egy adott weboldalon). Egy megfelelő plugin segítségével bármely más, [[Memento Project|memento]] kompatibilis, illetve [[Wayback|OWB]]-t vagy [[PyWb]]-t használó archívum is beilleszthető a tananyagokba a fejlesztő intézmények webarchívumai mellé. |
||
A lap jelenlegi, 2025. május 6., 08:54-kori változata
(GLAM Workbench / Web Archives)
A Tim Sherratt által gondozott, a közgyűjtemények digitális szolgáltatásainak használatát oktató GLAM Workbench projekt webarchívumokkal foglalkozó fejezete. A projektet az ausztrál, a brit, az új-zélandi webarchívumok, valamint az Internet Archive gondozzák és az IIPC finanszírozza a kezdeti munkálatokat. Számítanak az IIPC Kutatási Munkacsoport tagjainak, illetve az egyes konzorciumi tagoknak a közreműködésére is. A projektben a Jupyter Notebook alkalmazásfelület segítségével olyan tananyagokat fejlesztenek, melyekkel a gyűjtemények kutatási célú felhasználásának különféle formái sajátíthatók el. Az interaktív tananyaggyűjtemény elérhető felhőszolgáltatásként többféle - publikus vagy regisztrációhoz kötött - platformon (Binder, Reclaim Cloud, Nectar Cloud), illetve Docker konténerként saját gépre is feltehető. A főbb témakörök: adattípusok (Memento protokoll, Timegate, TimeMap, CDX API), adatkészletek létrehozása (archív URL-ek, aldomének, szövegek és prezentációk kinyerése), változások felderítése (két archivált verzió összehasonlítása, egy weboldal időbeli változása oldalképek, illetve szövegek összehasonlítása alapján, egy adott szöveg megjelenése és/vagy eltűnése egy adott weboldalon). Egy megfelelő plugin segítségével bármely más, memento kompatibilis, illetve OWB-t vagy PyWb-t használó archívum is beilleszthető a tananyagokba a fejlesztő intézmények webarchívumai mellé.