Nagyméretű webarchívumok indexelésére is alkalmas Python scriptek, melyekkel kinyerhetők az URL-ek a WARC (vagy ARC) csomagokból CDX indexfájlokba.