JHOVE2

Innen: MIA

A Harvard University and JSTOR Electronic Archiving Initiative által fejlesztett, Java-ban írt open source alkalmazás és keretrendszer fájlok formátumának felismeréséhez és jellemzéséhez. Ilyen kérdésekre ad választ egy - pl. egy webarchívumban található - ismeretlen fájl esetében: Mi ez? Tényleg az-e? Mit lehet róla tudni? Mi legyen vele? A válaszok négy munkafolyamatot igényelnek:

  • identification (a fájltípus valószínűsítése, pl. a fájlnév végződése vagy a fájlban levő, egyes formátumokra jellemző bájtok, "varázsszámok" alapján)
  • validation (annak az ellenőrzése, hogy a fájl szerkezete tényleg megfelel-e a valószínűsített formátumnak)
  • feature extraction (belső jellemzők, metaadatok kinyerése a fájlból, amelyek segítik a megőrzésére vonatkozó döntést)
  • assessment (az előre definiált szempontok alapján annak eldöntése, hogy mi legyen a fájllal, pl. milyen szintű megőrzésre érdemes)

A validation és a feature extraction műveletet ezekre a fájltípusokra tudja elvégezni: JPEG 2000, TIFF, PDF, SGML, XML, UTF-8 kódolású TEXT, ZIP, WAVE. (A korábbi JHOVE verzió még ezeket is ismerte: AIFF, GIF, HTML, JPEG, de az JHOVE2 projektben nem volt már rájuk pénzforrás.) Az identification funkció természetesen jóval több fájlformátumra működik.