„Crawler4j” változatai közötti eltérés

Innen: MIA
(Új oldal, tartalma: „2010-2018 között fejlesztett, nyílt forráskódú, Java nyelven írt, több szálon történő adatgyűjtésre is képes web crawler program. Beállítható a m…”)
 
 
(Egy közbenső módosítás ugyanattól a szerkesztőtől nincs mutatva)
1. sor: 1. sor:
2010-2018 között fejlesztett, nyílt forráskódú, Java nyelven írt, több szálon történő adatgyűjtésre is képes web [[crawler]] program. Beállítható a mélység, a bináris fájlok letölthetősége, az URL-ek maximális száma, a [User-agent | user-agent] string, a politeness szintje (agresszívra állítva másodpercenként 200 Wikipédia oldalt is letölt!). A megszakadt job folytatható, a tartalom pedig Postgres adatbázisba is menthető.
+
2010-2018 között fejlesztett, nyílt forráskódú, Java nyelven írt, több szálon történő adatgyűjtésre is képes web [[crawler]] program. Beállítható a mélység, a bináris fájlok letölthetősége, az URL-ek maximális száma, a [[user-agent]] string, a politeness szintje (agresszívra állítva másodpercenként 200 Wikipédia oldalt is letölt!). A megszakadt job folytatható, a tartalom pedig Postgres adatbázisba is menthető.
   
 
----
 
----

A lap jelenlegi, 2021. szeptember 6., 21:57-kori változata

2010-2018 között fejlesztett, nyílt forráskódú, Java nyelven írt, több szálon történő adatgyűjtésre is képes web crawler program. Beállítható a mélység, a bináris fájlok letölthetősége, az URL-ek maximális száma, a user-agent string, a politeness szintje (agresszívra állítva másodpercenként 200 Wikipédia oldalt is letölt!). A megszakadt job folytatható, a tartalom pedig Postgres adatbázisba is menthető.