Crawler4j

Innen: MIA
A lap korábbi változatát látod, amilyen Admin (vitalap | szerkesztései) 2021. szeptember 6., 21:56-kor történt szerkesztése után volt. (Új oldal, tartalma: „2010-2018 között fejlesztett, nyílt forráskódú, Java nyelven írt, több szálon történő adatgyűjtésre is képes web crawler program. Beállítható a m…”)
(eltér) ← Régebbi változat | Aktuális változat (eltér) | Újabb változat→ (eltér)

2010-2018 között fejlesztett, nyílt forráskódú, Java nyelven írt, több szálon történő adatgyűjtésre is képes web crawler program. Beállítható a mélység, a bináris fájlok letölthetősége, az URL-ek maximális száma, a [User-agent | user-agent] string, a politeness szintje (agresszívra állítva másodpercenként 200 Wikipédia oldalt is letölt!). A megszakadt job folytatható, a tartalom pedig Postgres adatbázisba is menthető.