Szerkesztő közreműködései
(legutolsó | legelső) (100 újabb | 100 régebbi) (20 | 50 | 100 | 250 | 500)
- 2021. szeptember 8., 19:26 (eltér | történet) . . (+212) . . Ú Metis (Új oldal, tartalma: „Java alapú, 2002-2003-ban írt open source program, mely egy web spiderből és egy riportgeneráló komponensből áll. ---- * [http://www.severus.org/sacha/metis/…”) (aktuális)
- 2021. szeptember 8., 19:11 (eltér | történet) . . (+271) . . Ú Lassie (Új oldal, tartalma: „Pythonban írt program, mely weboldalakból nyer ki alapadatokat. 2013 óta fejleszti a készítője. ---- * [https://github.com/michaelhelmick/lassie/ A Lassie a Git…”) (aktuális)
- 2021. szeptember 8., 18:58 (eltér | történet) . . (+492) . . Ú Knowlesys Web Data Miner Studio (Új oldal, tartalma: „2003-ban alapított kínai adatbányász cég által fejlesztett fizetős szoftvercsomag Windows-ra, mely helyi állományokból (HTML, JSON, XML, TXT, CSV, RTF, Word,…”) (aktuális)
- 2021. szeptember 8., 18:37 (eltér | történet) . . (+390) . . Ú Jspider (Új oldal, tartalma: „Különféle kiegészítőkkel rugalmasan bővíthető, 2003-ban Java nyelven írt web spider program. A kiegészítők felhasználhatók például halott linkek ellen…”) (aktuális)
- 2021. szeptember 8., 18:33 (eltér | történet) . . (+254) . . Ú Jedi-crawler (Új oldal, tartalma: „2013-ban Javascriptben írt, Node/PhantomJS modulként, Linuxon futó web crawler program. Ajax-ot használó oldalakat is be tud járni. ---- * [https://classic.…”) (aktuális)
- 2021. szeptember 8., 18:29 (eltér | történet) . . (+301) . . Ú Iwebcrawler (Új oldal, tartalma: „2010-ben C# programnyelven írt, több szálon futó és további funkciókkal bővíthető web crawler. ASP.NET-alapú szerveren futtatható, MS-SQL adatbázis há…”) (aktuális)
- 2021. szeptember 8., 17:48 (eltér | történet) . . (+793) . . Ú ItSucks (Új oldal, tartalma: „2007 és 2010 között fejlesztett, Java nyelven írt platformfüggetlen crawler, sokféle paraméterezési lehetőséggel. Grafikus és parancssoros felületen ker…”) (aktuális)
- 2021. szeptember 8., 17:07 (eltér | történet) . . (+560) . . Ú IRobotSoft (Új oldal, tartalma: „Utoljára 2018-ban frissített, Internet Explorert használó, egy példányban futtatva ingyenes web scraping program Windows alá, illetve parancsmódban Linuxra…”) (aktuális)
- 2021. szeptember 8., 16:30 (eltér | történet) . . (+317) . . Ú Import.io (Új oldal, tartalma: „Amerikai és brit székhelyű, üzleti célú webes adatgyűjtéssel és -elemzéssel foglalkozó cég. Fejlett, rámutatással és kattintgatással betanítható web…”) (aktuális)
- 2021. szeptember 8., 16:07 (eltér | történet) . . (+581) . . Ú Icrawler (Új oldal, tartalma: „2018 óta fejlesztett, Python nyelven írt, kis méretű és rugalmasan bővíthető, több szálon futó crawler, elsősorban képek és videók letöltésére, de…”) (aktuális)
- 2021. szeptember 8., 15:40 (eltér | történet) . . (+288) . . Ú Html2warc (Új oldal, tartalma: „2015-ben írt egyszerű Python script, ami egy alkönyvtárban levő fájlokat WARC formátumra konvertál. Paraméterként megadható egy URL cím, amit a fájlok…”) (aktuális)
- 2021. szeptember 8., 15:34 (eltér | történet) . . (+25) . . Html-snapshots (aktuális)
- 2021. szeptember 8., 15:33 (eltér | történet) . . (0) . . Html-snapshots
- 2021. szeptember 8., 15:32 (eltér | történet) . . (+528) . . Ú Html-snapshots (Új oldal, tartalma: „PhantomJS-t használó Javasript könyvtár, amivel Crawler-friendly website HTML formátumra konvertálható egy Ajax-alapú vagy egyoldalas alk…”)
- 2021. szeptember 8., 15:08 (eltér | történet) . . (+392) . . Ú Gungho (Új oldal, tartalma: „2007-2008-ban Perl nyelven japánok által fejlesztett web crawler keretrendszer. Három fő részből áll: a Provider küldi a kéréseket, a Handler kezeli a let…”) (aktuális)
- 2021. szeptember 8., 14:53 (eltér | történet) . . (+379) . . Ú Gecco (Új oldal, tartalma: „Kínai programozó által 2016-2017-ben Java nyelven írt, Redis adatbázikezelőt használó, web scraping célú crawlerek készítésére használható keretrend…”) (aktuális)
- 2021. szeptember 7., 23:01 (eltér | történet) . . (+547) . . Ú EIS Archiver (Új oldal, tartalma: „Az Egyesült Államok Környezetvédelmi Ügynöksége számára 2016-2017-ben kifejlesztett, Docker csomagként telepíthető, parancsmódú webarchiváló eszköz. Az…”) (aktuális)
- 2021. szeptember 7., 16:50 (eltér | történet) . . (+520) . . Ú Dryscrape (Új oldal, tartalma: „Német programozó által 2012-2015 között Python nyelven írt programkönyvtár Mac OS X és Ubuntu ill. Arch Linux alá, web scraping feladatokra, akár sok Javascr…”) (aktuális)
- 2021. szeptember 7., 14:42 (eltér | történet) . . (+563) . . Ú DownThemAll! (Új oldal, tartalma: „Utoljára 2019-ben frissített, Firefox, Chrome és Opera böngészőkhöz telepíthető kiegészítő, amivel egy weboldalról az összes kép vagy egyéb belinkelt f…”) (aktuális)
- 2021. szeptember 7., 14:28 (eltér | történet) . . (+103) . . Django Dynamic Scraper (aktuális)
- 2021. szeptember 7., 14:26 (eltér | történet) . . (+402) . . Ú Django Dynamic Scraper (Új oldal, tartalma: „Berlini programozó által 2011 óta fejlesztett Python-alapú applikáció a Django webes keretrendszerhez, amivel Scrapy-típusú spiderek hozhatók létre és me…”)
- 2021. szeptember 7., 14:13 (eltér | történet) . . (+11) . . Diffbot (aktuális)
- 2021. szeptember 7., 14:12 (eltér | történet) . . (+777) . . Ú Diffbot (Új oldal, tartalma: „= (korábban: CrawlBot) = Amerikai web scraping cég, ami a crawler és extractor mellett webes forrásokból tudásgráfot készítő alkalmazást is fejleszt ter…”)
- 2021. szeptember 7., 11:30 (eltér | történet) . . (+937) . . Ú DEiXTo (Új oldal, tartalma: „2007 és 2014 között görög egyetemi szakemberek által fejlesztett ingyenes web scraping szoftver Windowsra. Az adatok köre az Internet Explorerre épülő GUI…”) (aktuális)
- 2021. szeptember 7., 10:36 (eltér | történet) . . (+947) . . Ú DeepVaccum (Új oldal, tartalma: „2006 és 2013 között fejlesztett telepítő és grafikus felület a wget crawlerhez Macintosh gépekre (Mac OS X verziókhoz). A weboldalak mentésén kívül…”) (aktuális)
- 2021. szeptember 6., 22:57 (eltér | történet) . . (-13) . . Crawler4j (aktuális)
- 2021. szeptember 6., 22:56 (eltér | történet) . . (+2) . . Crawler4j
- 2021. szeptember 6., 22:56 (eltér | történet) . . (+559) . . Ú Crawler4j (Új oldal, tartalma: „2010-2018 között fejlesztett, nyílt forráskódú, Java nyelven írt, több szálon történő adatgyűjtésre is képes web crawler program. Beállítható a m…”)
- 2021. szeptember 6., 22:40 (eltér | történet) . . (+333) . . Ú Crawler.js (Új oldal, tartalma: „2021-ben írt PhantomJS script, ami Ajax-alapú dinamikus weboldalakból statikus HTML fájlokat készít, melyeket könnyebben feldolgoznak a keresőgépek robotja…”) (aktuális)
- 2021. szeptember 6., 22:24 (eltér | történet) . . (+338) . . Ú Crawler (FCC) (Új oldal, tartalma: „Az amerikai Federal Communications Commission számára 2011-2012-ben PHP nyelven írt egyszerű, gyors crawler, ami készít egy indexet a megadott webhelyen talá…”) (aktuális)
- 2021. szeptember 6., 22:13 (eltér | történet) . . (+302) . . Ú Cl-web-crawler (Új oldal, tartalma: „2007-ben írt web crawler könyvtár a Common Lisp-hez. Csak az alapfunkciókat tudja, azokat sem hatékonyan, de ez volt az első ilyen eszköz ehhez a programnyel…”) (aktuális)
- 2021. szeptember 6., 22:04 (eltér | történet) . . (+789) . . Ú Bixo (Új oldal, tartalma: „2009 és 2015 között, főként Arc és részben Java nyelven fejlesztett, Hadoop környezetben futó, adatbányász alkalmazásokhoz használható open source esz…”) (aktuális)
- 2021. szeptember 5., 12:39 (eltér | történet) . . (0) . . Browsertrix
- 2021. szeptember 5., 12:38 (eltér | történet) . . (-4) . . Browsertrix
- 2021. szeptember 5., 12:36 (eltér | történet) . . (+4) . . Browsertrix
- 2021. szeptember 5., 12:25 (eltér | történet) . . (-3) . . Browsertrix
- 2021. szeptember 5., 12:24 (eltér | történet) . . (+10) . . Browsertrix
- 2021. szeptember 5., 12:22 (eltér | történet) . . (+571) . . Browsertrix
- 2021. szeptember 5., 11:13 (eltér | történet) . . (+1 893) . . Browsertrix
- 2021. szeptember 5., 10:45 (eltér | történet) . . (-3) . . Browsertrix
- 2021. szeptember 4., 14:58 (eltér | történet) . . (-1) . . Archívumtípusok
- 2021. augusztus 20., 20:41 (eltér | történet) . . (+582) . . Ú Arale (Új oldal, tartalma: „2001-ben Java nyelven írt web spider program. Linux vagy Windows alatt futtatható parancssoros szoftver, Java Runtime Environment-et igényel. Megadható a letöltend…”) (aktuális)
- 2021. augusztus 20., 19:15 (eltér | történet) . . (+477) . . Ú Goutte (Új oldal, tartalma: „2012 óta PHP nyelven fejlesztett egyszerű web scraper programkönyvtár, aminek az API-ján keresztül lehet webhelyeket egy robottal bejárni, majd a begyűjtött HT…”) (aktuális)
- 2021. augusztus 20., 19:05 (eltér | történet) . . (+691) . . Ú Panther (Új oldal, tartalma: „A Symfony nevű, webhelyek és webapplikációk készítésére szolgáló PHP keretrendszer részeként egy francia informatikus által 2018 óta fejlesztett böngész…”) (aktuális)
- 2021. augusztus 20., 18:50 (eltér | történet) . . (+644) . . Ú Arachnid (PHP) (Új oldal, tartalma: „Arab származású informatikus által 2013 óta fejlesztett PHP nyelvű crawler, ami a Panther és a Goutte programkönyvtárak segítségével követi egy…”) (aktuális)
- 2021. augusztus 20., 18:15 (eltér | történet) . . (+344) . . Ú Arachnid (Java) (Új oldal, tartalma: „2002-ben Java nyelven írt egyszerű spider program, két mintapéldával. Inkább csak saját szerveren ajánlott használni, mert nagyon leterhelheti a külső websze…”) (aktuális)
- 2021. augusztus 19., 13:54 (eltér | történet) . . (+1 043) . . Ú Apify (Új oldal, tartalma: „= (korábban: Apifier) = Prágai cég által fejlesztett szoftvercsomag, valamint fizetős felhőszolgáltatás különféle webes feladatok automatizálására: péld…”) (aktuális)
- 2021. augusztus 19., 13:15 (eltér | történet) . . (+441) . . Ú API Blender (Új oldal, tartalma: „Az ARCOMEM projekt keretében 2012 és 2015 között fejlesztett, Python nyelven írt szoftver különféle webkettes szerverek (Twitter, Facebook, Flickr, Google+,…”) (aktuális)
- 2021. augusztus 19., 12:59 (eltér | történet) . . (+581) . . Ú Aperture (Új oldal, tartalma: „2006 és 2010 között fejlesztett Java programkörnyezet teljes szövegek és metaadatok kinyerésére és visszakeresésére e-mail szerverekből vagy egyedi postafi…”) (aktuális)
- 2021. augusztus 19., 12:00 (eltér | történet) . . (+643) . . Ú Anemone (Új oldal, tartalma: „Amerikai programozó által 2010-2012 között fejlesztett, Ruby nyelven írt web spider keretrendszer. Linux alatt fut, KyotoCabinet, Tokyo Cabinet, MongoDB vagy Redis…”) (aktuális)
- 2021. augusztus 19., 11:12 (eltér | történet) . . (+325) . . Ú Andjing (Új oldal, tartalma: „2008-as, "pre alpha" állapotban maradt, php-ban írt és CLI környezetben futó, MySQL adatbázisba mentő egyszerű crawler, ami továbbfejleszthető akár webta…”) (aktuális)
- 2021. augusztus 19., 11:03 (eltér | történet) . . (+42) . . Abot (aktuális)
- 2021. augusztus 19., 11:01 (eltér | történet) . . (+78) . . Abot
- 2021. augusztus 19., 11:00 (eltér | történet) . . (+749) . . Ú Abot (Új oldal, tartalma: „Amerikai programozó által 2014 óta C# nyelven fejlesztett open source web crawler keretrendszer. Nagyon gyors, kis méretű, több szálon futó, jól testreszab…”)
- 2021. augusztus 19., 10:36 (eltér | történet) . . (+976) . . Ú 80legs (Új oldal, tartalma: „Texasi székhelyű, web scrapinggel foglalkozó cég. Háromféle felhő-alapú szolgáltatást nyújtanak: A "Custom Web Crawling" esetében a felhasználó állí…”) (aktuális)
- 2021. augusztus 2., 18:34 (eltér | történet) . . (+428) . . Ú YourTwapperKeeper (Új oldal, tartalma: „A 2010-es évek első felében fejlesztett, PHP és Perl nyelven írt, a TwapperKeeper.com címen működött Twitter letöltő szolgáltatás saját virtuális szerver…”) (aktuális)
- 2021. augusztus 2., 18:27 (eltér | történet) . . (+4) . . Virginia Tech Events Archive (aktuális)
- 2021. augusztus 2., 18:17 (eltér | történet) . . (+616) . . Ú Twitter Database Server (Új oldal, tartalma: „Adam Green, Twitter API szakértő által a 2010-es évek első felében a 140dev nevű keretrendszer részeként írt PHP könyvtár. A Twitter ún. streaming API-ján…”) (aktuális)
- 2021. augusztus 2., 17:34 (eltér | történet) . . (+279) . . Ú Simplecrawler (Új oldal, tartalma: „A Node.js környezetben futtatható, nagyon rugalmasan konfigurálható és skálázható, 2015 és 2020 között JavaScript-ben fejlesztett crawler, saját API-val…”) (aktuális)
- 2021. augusztus 2., 17:21 (eltér | történet) . . (+574) . . Ú Webapp (Új oldal, tartalma: „A DataRescue mozgalomból kinőtt, a weben közzétett tudományos adatok közösségi megőrzésével foglalkozó Data Together projekt keretében 2017-2018 közö…”) (aktuális)
- 2021. augusztus 2., 17:13 (eltér | történet) . . (+55) . . DataRescue (aktuális)
- 2021. augusztus 2., 17:03 (eltér | történet) . . (+1 046) . . Ú Sentry (Új oldal, tartalma: „A Data Together projekt webapp nevű applikációjához 2017-2018-ban Go nyelven írt web crawler, ami önállóan is használható. Az URL-eknek, a webszervere…”) (aktuális)
- 2021. augusztus 2., 16:28 (eltér | történet) . . (+658) . . Ú SeimiCrawler (Új oldal, tartalma: „Kínai programozó által 2015-2019 között Java-ban írt crawler-fejlesztő keretrendszer, melyet a Python-alapú Scrapy inspirált és a Java nyelv, valamint a J…”) (aktuális)
- 2021. augusztus 2., 16:08 (eltér | történet) . . (+719) . . Ú Screen-scraper (Új oldal, tartalma: „A 2000-es évek elején indult, amerikai fejlesztésű, teljes körű web scraping rendszer és szolgáltatás. Az első verzió még Perl-ben íródott, majd Java-…”) (aktuális)
- 2021. augusztus 2., 15:08 (eltér | történet) . . (+1 116) . . Ú ScrapeStorm (Új oldal, tartalma: „A kínai Hangzhou Duosuan Technology Co. Ltd. web scraping szoftvere és szolgáltatása, melyet egy keresőszolgáltatás specialista, korábbi Google alkalmazott…”) (aktuális)
- 2021. augusztus 2., 14:33 (eltér | történet) . . (0) . . ScrapeKit (aktuális)
- 2021. augusztus 2., 14:33 (eltér | történet) . . (+531) . . Ú ScrapeKit (Új oldal, tartalma: „Az "African Network of Centers for Investigative Reporting" nevű projekthez egy német programozó által készített, de 2014-ben félbemaradt fejlesztésű Python k…”)
- 2021. augusztus 2., 14:17 (eltér | történet) . . (+1) . . Scrala (aktuális)
- 2021. augusztus 2., 14:17 (eltér | történet) . . (+303) . . Ú Scrala (Új oldal, tartalma: „Kínai programozó 2015-2016-os fejlesztése. A Scrapy rendszer által inspirált, Scala nyelven írt web scraper program-kezdemény. ---- * [https://github.c…”)
- 2021. augusztus 2., 14:09 (eltér | történet) . . (+513) . . Ú Python-Goose (Új oldal, tartalma: „Francia programozó által 2013 és 2015 között fejlesztett Python könyvtár (korábbi verziója Goose néven még Java-ban íródott), mellyel híroldalakról lehet…”) (aktuális)
- 2021. augusztus 2., 13:57 (eltér | történet) . . (+1 015) . . Ú ParseHub (Új oldal, tartalma: „Kanadai cég Macintosh, Windows és Linux gépeken is futtatható web scraping szoftvere és felhőszolgáltatása. Az ingyenes változatban csak 200 oldal tölthet…”) (aktuális)
- 2021. augusztus 2., 12:54 (eltér | történet) . . (+438) . . Ú Paparazzi! (Új oldal, tartalma: „Amerikai programozó által 2005-2019 között macOS-re fejlesztett egyszerű weboldalkép-készítő program. Az URL címeket a böngésző könyvjelzőiből is import…”) (aktuális)
- 2021. augusztus 1., 20:09 (eltér | történet) . . (+34) . . Octoparse (aktuális)
- 2021. augusztus 1., 18:56 (eltér | történet) . . (+130) . . Octoparse
- 2021. augusztus 1., 18:48 (eltér | történet) . . (+873) . . Ú Octoparse (Új oldal, tartalma: „Az amerikai központú Octopus Data Inc. 2016 óta fejlesztett web scraping rendszere, mely Windows és macOS rendszerű gépekre is telepíthető, valamint felhős…”)
- 2021. augusztus 1., 18:03 (eltér | történet) . . (+166) . . Kulturarw3 (svéd) (aktuális)
- 2021. augusztus 1., 17:57 (eltér | történet) . . (+901) . . Ú HTTP::Recorder (Új oldal, tartalma: „2004-2005 között fejlesztett program, amivel Perl scriptek formájában rögzíthető minden felhasználói interakció egy webhely böngészése közben, majd vissza…”) (aktuális)
- 2021. augusztus 1., 15:02 (eltér | történet) . . (+1) . . Electronic Publications Pilot Project (aktuális)
- 2021. augusztus 1., 15:02 (eltér | történet) . . (+1 269) . . Ú Electronic Publications Pilot Project (Új oldal, tartalma: „= (EPPP) = A National Library of Canada 1994 júniusa és 1995 júliusa között lezajlott pilot projektje, melynek keretében először kísérleteztek e-periodikák…”)
- 2021. augusztus 1., 11:42 (eltér | történet) . . (+73) . . ArchivetheNet (aktuális)
- 2021. augusztus 1., 11:28 (eltér | történet) . . (+848) . . Ú RAY (Új oldal, tartalma: „A svájci Aleph Archives cég által működtetett archiváló szolgáltatás, amivel HTML, WARC, PDF és PNG formátumba lehet weboldalakról mentéseket csinálni…”) (aktuális)
- 2021. augusztus 1., 11:10 (eltér | történet) . . (+4) . . WAB (aktuális)
- 2021. augusztus 1., 11:10 (eltér | történet) . . (+4) . . Web archiving service (aktuális)
- 2021. augusztus 1., 11:09 (eltér | történet) . . (+4) . . CAMA (aktuális)
- 2021. augusztus 1., 11:09 (eltér | történet) . . (+4) . . KEN (aktuális)
- 2021. augusztus 1., 11:08 (eltér | történet) . . (+712) . . Ú Aleph Archives (Új oldal, tartalma: „2010-ben alapított svájci cég, melynek fő profilja az ügyfeleik számára végzett archiválás a weboldalakról, a közösségi médiából és a csoportmunka ren…”) (aktuális)
- 2021. július 25., 16:44 (eltér | történet) . . (+596) . . Ú Domain Browser (Új oldal, tartalma: „Az Internet Archive belső eszköze az archiválandó webhelyek prioritásának meghatározásához a Hericrawler számára. Az archiválási szempontból érde…”) (aktuális)
- 2021. július 25., 16:31 (eltér | történet) . . (+365) . . Ú Hericrawler (Új oldal, tartalma: „Az Internet Archive által használt, saját fejlesztésű rendszer a nagy méretű aratások során a crawler vezérlésére a bejárási sorrendet illetően.…”) (aktuális)
- 2021. július 25., 16:00 (eltér | történet) . . (-1) . . DataRescue
- 2021. július 25., 16:00 (eltér | történet) . . (+955) . . Ú EDGI Website Monitoring (Új oldal, tartalma: „= (Scanner) = A DataRescue mozgalmat is koordináló Environmental Data & Governance Initiative (EDGI) egyik projektje és a hozzá tartozó eszközkészlet, melly…”) (aktuális)
- 2021. július 25., 15:23 (eltér | történet) . . (+1 631) . . Ú DataRescue (Új oldal, tartalma: „= (Data Rescue) = A DataRescue egy mozgalom és eseménysorozat, mely Donald Trump elnökké választásakor kapott nagy figyelmet és lendületet, amikor is egyetemi…”)
- 2021. július 25., 12:11 (eltér | történet) . . (+1 400) . . Ú Lumen (Új oldal, tartalma: „Egy amerikai ügyvédnő, a W3C egyik tagja által 2002-ben indított és 2015-ig Chilling Effects néven futó projekt az internetről vagy a keresőrendszerekből "no…”) (aktuális)
- 2021. július 25., 11:03 (eltér | történet) . . (+122) . . Robust Links Tools (aktuális)
- 2021. július 25., 11:01 (eltér | történet) . . (+1 460) . . Ú Always Online (Új oldal, tartalma: „A Cloudflare nevű amerikai web infrastruktúra és biztonsági cég egyik szolgáltatása, mellyel akkor is megnézhető marad egy webhely, ha az eredeti szerver éppe…”) (aktuális)
- 2021. július 25., 10:21 (eltér | történet) . . (+17) . . Warrior (aktuális)
- 2021. július 25., 10:19 (eltér | történet) . . (0) . . Warrior
- 2021. július 25., 10:18 (eltér | történet) . . (+1 740) . . Ú Warrior (Új oldal, tartalma: „= (ArchiveTeam Warrior) = Az Archive Team által fejlesztett virtuális gép, mellyel önkéntesek be tudnak kapcsolódni archiváló projektekbe a saját számít…”)
- 2021. július 24., 20:28 (eltér | történet) . . (+1) . . Smart Cache Loader (aktuális)
- 2021. július 24., 20:28 (eltér | történet) . . (+501) . . Ú Smart Cache Loader (Új oldal, tartalma: „Cseh programozó által 2003-2010 közt fejlesztett parancsmódú, még a wget-nél is rugalmasabban konfigurálható, Java-alapú crawler, ami a fájlrendszerb…”)
- 2021. július 24., 20:02 (eltér | történet) . . (0) . . Sparkler (aktuális)