Bixo

Innen: MIA
A lap korábbi változatát látod, amilyen Admin (vitalap | szerkesztései) 2021. szeptember 6., 21:04-kor történt szerkesztése után volt. (Új oldal, tartalma: „2009 és 2015 között, főként Arc és részben Java nyelven fejlesztett, Hadoop környezetben futó, adatbányász alkalmazásokhoz használható open source esz…”)
(eltér) ← Régebbi változat | Aktuális változat (eltér) | Újabb változat→ (eltér)

2009 és 2015 között, főként Arc és részben Java nyelven fejlesztett, Hadoop környezetben futó, adatbányász alkalmazásokhoz használható open source eszközkészlet. Egy "udvarias", de nagyon hatékony, a megtalált URL-eket kis csoportokra osztva egyszerre sok szálon arató crawler van hozzá, a begyűjtött tartalmat pedig az Apache Tika elemzi ki. Olyan cégek is használták, mint az EMI Music, zenei előadók népszerűségi adatainak kigyűjtésére a Facebook-ról.