Jupyter notebooks for web archives

Innen: MIA

(GLAM Workbench / Web Archives)

A Tim Sherratt által gondozott, a közgyűjtemények digitális szolgáltatásainak használatát oktató GLAM Workbench projekt webarchívumokkal foglalkozó fejezete. A projektet az ausztrál, a brit, az új-zélandi webarchívumok, valamint az Internet Archive gondozzák és az IIPC finanszírozza a kezdeti munkálatokat. Számítanak az IIPC Kutatási Munkacsoport tagjainak, illetve az egyes konzorciumi tagoknak a közreműködésére is. A projektben a Jupyter Notebook alkalmazásfelület segítségével olyan tananyagokat fejlesztenek, melyekkel a gyűjtemények kutatási célú felhasználásának különféle formái sajátíthatók el. Az interaktív tananyaggyűjtemény elérhető felhőszolgáltatásként többféle - publikus vagy regisztrációhoz kötött - platformon (Binder, Reclaim Cloud, Nectar Cloud), illetve Docker konténerként saját gépre is feltehető. A főbb témakörök: adattípusok (Memento protokoll, Timegate, TimeMap, CDX API), adatkészletek létrehozása (archív URL-ek, aldomének, szövegek és prezentációk kinyerése), változások felderítése (két archivált verzió összehasonlítása, egy weboldal időbeli változása oldalképek, illetve szövegek összehasonlítása alapján, egy adott szöveg megjelenése és/vagy eltűnése egy adott weboldalon). Egy megfelelő plugin segítségével bármely más, memento kompatibilis, illetve OWB-t vagy PyWb-t használó archívum is beilleszthető a tananyagokba a fejlesztő intézmények webarchívumai mellé.