Az ArchiveSpark projekt előzménye, amely az Apache Pig keretrendszert használja a WARC fájlok feldolgozásához.