JHOVE2
A Harvard University and JSTOR Electronic Archiving Initiative által fejlesztett, Java-ban írt open source alkalmazás és keretrendszer fájlok formátumának felismeréséhez és jellemzéséhez. Ilyen kérdésekre ad választ egy - pl. egy webarchívumban található - ismeretlen fájl esetében: Mi ez? Tényleg az-e? Mit lehet róla tudni? Mi legyen vele? A válaszok négy munkafolyamatot igényelnek:
- identification (a fájltípus valószínűsítése, pl. a fájlnév végződése vagy a fájlban levő, egyes formátumokra jellemző bájtok, "varázsszámok" alapján)
- validation (annak az ellenőrzése, hogy a fájl szerkezete tényleg megfelel-e a valószínűsített formátumnak)
- feature extraction (belső jellemzők, metaadatok kinyerése a fájlból, amelyek segítik a megőrzésére vonatkozó döntést)
- assessment (az előre definiált szempontok alapján annak eldöntése, hogy mi legyen a fájllal, pl. milyen szintű megőrzésre érdemes)
A validation és a feature extraction műveletet ezekre a fájltípusokra tudja elvégezni: JPEG 2000, TIFF, PDF, SGML, XML, UTF-8 kódolású TEXT, ZIP, WAVE. (A korábbi JHOVE verzió még ezeket is ismerte: AIFF, GIF, HTML, JPEG, de az JHOVE2 projektben nem volt már rájuk pénzforrás.) Az identification funkció természetesen jóval több fájlformátumra működik.