Archive-friendly website
A lap korábbi változatát látod, amilyen Admin (vitalap | szerkesztései) 2024. szeptember 5., 14:05-kor történt szerkesztése után volt.
Olyan webhely, amely nemcsak crawler-friendly, vagyis robotokkal könnyen bejárható, hanem jó minőségben archiválható is: a lementett változat tartalmában, megjelenésében és funkcionalitásában kellően hű mása az eredetinek. Többek között ilyen szempontoknak érdemes megfelelni:
- logikus site-struktúra, amelynek a felépítése az URL címekben is tükröződik, mert így könnyebb kiválasztani az archiválásra érdemes részeket és utólag ellenőrizni az eredményt
- valid HTML és CSS kód, ami lehetővé teszi a helyes megjelenítést a szabványokat követő böngészőkben a jövőben is
- ékezetek és egyes speciális karakterek kerülése az alkönyvtárak és a fájlok neveiben
- lehetőleg nyílt fájlformátumok használata, melyek hosszú távon is megjeleníthetők maradnak
- nincs benne olyan speciális formátumú tartalom, amihez külön megjelenítőt/böngésző-kiegészítőt kell telepíteni
- a hang és a videó tartalom nem sugárzott (stream) módon van beágyazva, hanem letölthető fájlok formájában (is)
- a robots.txt fájlban nincs letiltva a külalakot szabályozó (pl. .css) fájlok letöltése
- nem tartalmaz olyan szerver oldalon futó scripteket, programokat, vagy adatbázist, amelyek nélkül a website használhatatlan
- a webszerver nem használ olyan session vagy persistent típusú cookie-kat, amelyek alapvetően befolyásolják a megjelenő tartalmat (pl. a felhasználói felület nyelvét)
- részletes beágyazott metaadatok vannak a weboldalak fejlécében és az egyéb dokumentumokban (pl. képek, PDF fájlok), melyek megkönnyítik a begyűjtött digitális objektumok beazonosítását és automatikus metaadatolását
- a készítés vagy az utolsó módosítás dátumának feltüntetése a weboldalakon és a dokumentumokban, hogy az archivált változat használója meg tudja állapítani, mikor készültek (ne csak azt lássa, hogy mikor lettek archiválva)
- a webhely jogi közleményében kitér az archiválásra is (pl. "archiválható, de csak fél év után szolgáltatható és csak könyvtáron belül"), vagy egy CC licenccel szabályozza a felhasználást az archivált példány esetében is.
Az archiválhatósági jellemzők egy része könnyen ellenőrizhető egy website esetében olyan szolgáltatásokkal, mint például az Archive Ready.
- Nicholas Taylor: Web Archívability
- Robin C. Davis: Five Tips for Designing Preservable Websites
- Butch Lazorchak: Designing Preservable Websites, Redux
- arquivo.pt: Recommendations for authors to enable web archiving
- Columbia University Libraries: Guidelines for Preservable Websites
- Library of Congress: Creating Preservable Websites
- Bibliothèque nationale du Luxembourg: Is your website archive compliant?