„Archive-friendly website” változatai közötti eltérés

Innen: MIA
 
24. sor: 24. sor:
 
* [https://library.columbia.edu/collections/web-archives/guidelines.html Columbia University Libraries: Guidelines for Preservable Websites]
 
* [https://library.columbia.edu/collections/web-archives/guidelines.html Columbia University Libraries: Guidelines for Preservable Websites]
 
* [https://www.loc.gov/programs/web-archiving/for-site-owners/creating-preservable-websites/ Library of Congress: Creating Preservable Websites]
 
* [https://www.loc.gov/programs/web-archiving/for-site-owners/creating-preservable-websites/ Library of Congress: Creating Preservable Websites]
  +
* [https://www.webarchive.lu/is-your-website-archive-compliant/ Bibliothèque nationale du Luxembourg: Is your website archive compliant?]
   
 
[[Category:FOGALMAK]]
 
[[Category:FOGALMAK]]

A lap jelenlegi, 2024. szeptember 5., 14:05-kori változata

Olyan webhely, amely nemcsak crawler-friendly, vagyis robotokkal könnyen bejárható, hanem jó minőségben archiválható is: a lementett változat tartalmában, megjelenésében és funkcionalitásában kellően hű mása az eredetinek. Többek között ilyen szempontoknak érdemes megfelelni:

  • logikus site-struktúra, amelynek a felépítése az URL címekben is tükröződik, mert így könnyebb kiválasztani az archiválásra érdemes részeket és utólag ellenőrizni az eredményt
  • valid HTML és CSS kód, ami lehetővé teszi a helyes megjelenítést a szabványokat követő böngészőkben a jövőben is
  • ékezetek és egyes speciális karakterek kerülése az alkönyvtárak és a fájlok neveiben
  • lehetőleg nyílt fájlformátumok használata, melyek hosszú távon is megjeleníthetők maradnak
  • nincs benne olyan speciális formátumú tartalom, amihez külön megjelenítőt/böngésző-kiegészítőt kell telepíteni
  • a hang és a videó tartalom nem sugárzott (stream) módon van beágyazva, hanem letölthető fájlok formájában (is)
  • a robots.txt fájlban nincs letiltva a külalakot szabályozó (pl. .css) fájlok letöltése
  • nem tartalmaz olyan szerver oldalon futó scripteket, programokat, vagy adatbázist, amelyek nélkül a website használhatatlan
  • a webszerver nem használ olyan session vagy persistent típusú cookie-kat, amelyek alapvetően befolyásolják a megjelenő tartalmat (pl. a felhasználói felület nyelvét)
  • részletes beágyazott metaadatok vannak a weboldalak fejlécében és az egyéb dokumentumokban (pl. képek, PDF fájlok), melyek megkönnyítik a begyűjtött digitális objektumok beazonosítását és automatikus metaadatolását
  • a készítés vagy az utolsó módosítás dátumának feltüntetése a weboldalakon és a dokumentumokban, hogy az archivált változat használója meg tudja állapítani, mikor készültek (ne csak azt lássa, hogy mikor lettek archiválva)
  • a webhely jogi közleményében kitér az archiválásra is (pl. "archiválható, de csak fél év után szolgáltatható és csak könyvtáron belül"), vagy egy CC licenccel szabályozza a felhasználást az archivált példány esetében is.

Az archiválhatósági jellemzők egy része könnyen ellenőrizhető egy website esetében olyan szolgáltatásokkal, mint például az Archive Ready.