DOM

Innen: MIA

(Document Object Model)

Az HTML, XHTML és XML formátumú fájlokból a webböngészők által generált, hierarchikus objektummodell, programozható API, a weboldal kódjának a gép memóriájában való belső leképezése, amely alapján a böngésző azután megjeleníti az oldalt, illetve amelyet pl. Javascript utasításokkal módosítva változtatható az oldal szerkezete, tartalma vagy külalakja a felhasználó interakciói vagy egyéb események esetén. A DOM felépítését egy ún. böngészőmotor komponens végzi, amelyből többféle létezik és nem teljesen egyformán működnek, ezért egy weboldal megjelenése és viselkedése attól is függ, hogy éppen milyen böngészővel (böngészőmotorral) nézi a felhasználó. Vannak olyan motorok (pl. a WebKit és a Gecko), amelyeket több böngészőnél is használnak, ezek jobban törekednek a szabványok betartására.

Webarchiválási szempontból ez azt jelenti, hogy valójában nem elég csak a HTML vagy XML fájlokat megőrizni, meg kellene őrizni valahogy azokat a DOM-okat is, amelyek a webhely mentése idején használatosak, szabványosak voltak, ahhoz, hogy a jövőben helyesen lehessen rekonstruálni a weboldalak megjelenését és viselkedését. (Erre egy érdekes kísérlet volt az Oldweb today.) Továbbá az, hogy egy weboldal nem pusztán egy szövegfájl, hanem valójában egy program, amelyet egy böngészőmotor értelmez és futtat, azt is jelenti, hogy a bonyolult, dinamikusan változó weboldalakat az egyszerű fájletöltést végző crawler-ekkel nem, vagy csak nagyon töredékesen lehet archiválni. A megoldást ilyenkor egy headless browser közbeiktatása jelentheti, amely tartalmaz egy aktuálisan szabványos böngészőmotort.