Apache Tika
A lap korábbi változatát látod, amilyen Admin (vitalap | szerkesztései) 2017. július 25., 17:17-kor történt szerkesztése után volt. (Új oldal, tartalma: „Az Apache Software Foundation által (korábban az Apache Nutch, ill. a Lucene alprojektjeként) fejlesztett eszköz, ami megtalálja és kigyűjti a metaadatok…”)
Az Apache Software Foundation által (korábban az Apache Nutch, ill. a Lucene alprojektjeként) fejlesztett eszköz, ami megtalálja és kigyűjti a metaadatokat, valamint a szöveget több mint ezerféle fájlformátumból, alkalmassá téve így a fájlokat a visszakeresésre, a tartalomelemzésre stb. Jól használható webarchívumoknál is a nagy tömegű heterogén fájlhalmazok teljes szövegű indexeléshez való előkészítésére, ill. automatikus metaadatolására.