SHARC

Innen: MIA

(Sharp Archiving of Web-Site Captures)

A németországi Max Planck Institute for Informatics munkatársai által kidolgozott módszer, mellyel az "elmosódás" jelenségét próbálják csökkenteni a webarchiválás során. Mivel egy nagyobb site learatása órákig, sőt akár napokig is eltarthat egy polite crawlerrel, ezért időközben megváltozhatnak egyes oldalak, vagyis az archív példány nem egy éles pillanatfelvétel a site adott időpontbeli állapotáról, ami pl. jogi bizonyítékként való felhasználás esetében gond lehet, de archiválási szempontból sem szerencsés az ilyen inkoherencia. A SHARC módszer esetén a crawler egy webhely minden oldalát bejárja, majd újra visszamegy ezekre az oldalakra, és megnézi, hogy változott-e valamelyik. Ha a látogatási és visszalátogatási időszakok átfedésben vannak egymással és közben egyetlen oldal sem változott, akkor a webhely archív példánya olyan "élesnek" tekinthető, mintha egyetlen időpillanatban sikerült volna lementeni. Ezzel a technikával optimalizálni lehet egy webhely mentési gyakoriságát és maximalizálni ha nem is a teljes archivált site, de legalább egyes részeinek időbeli koherenciáját, javítva ezáltal az archívum minőségét.