Sentry

Innen: MIA
A lap korábbi változatát látod, amilyen Admin (vitalap | szerkesztései) 2021. augusztus 2., 16:03-kor történt szerkesztése után volt. (Új oldal, tartalma: „A Data Together projekt webapp nevű applikációjához 2017-2018-ban Go nyelven írt web crawler, ami önállóan is használható. Az URL-eknek, a webszervere…”)
(eltér) ← Régebbi változat | Aktuális változat (eltér) | Újabb változat→ (eltér)

A Data Together projekt webapp nevű applikációjához 2017-2018-ban Go nyelven írt web crawler, ami önállóan is használható. Az URL-eknek, a webszerverektől kapott válaszok header-jének és az aratási paramétereknek a tárolására egy Postgres adatbázist használ, magukat a letöltött weboldalakat pedig - egy hash érték generálása után - az Amazon felhőjébe tölti fel. Az ismétlő mentések gyakorisága paraméterezhető és a hash alapján észlelhetők az esetleges változtatások. Az adatállománynak kinéző URL címeket (pl. a .csv kiterjesztésre végződőket) automatikusan felismeri és külön szálon archiválja. A tervek közt szerepel, hogy az Amazon S3 felhője mellett az elosztott, InterPlanetary File System nevű rendszerben is tárolható legyen a learatott tartalom, illetve hogy ne csak a Postgres adatbázison keresztül lehessen újabb oldalakat hozzáadni a figyelt URL-ek listájához.