<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="hu">
	<id>https://webarchivum.oszk.hu/mediawiki/index.php?action=history&amp;feed=atom&amp;title=Web-Harvest</id>
	<title>Web-Harvest - Laptörténet</title>
	<link rel="self" type="application/atom+xml" href="https://webarchivum.oszk.hu/mediawiki/index.php?action=history&amp;feed=atom&amp;title=Web-Harvest"/>
	<link rel="alternate" type="text/html" href="https://webarchivum.oszk.hu/mediawiki/index.php?title=Web-Harvest&amp;action=history"/>
	<updated>2026-05-11T21:59:18Z</updated>
	<subtitle>Az oldal laptörténete a wikiben</subtitle>
	<generator>MediaWiki 1.31.16</generator>
	<entry>
		<id>https://webarchivum.oszk.hu/mediawiki/index.php?title=Web-Harvest&amp;diff=1474&amp;oldid=prev</id>
		<title>Admin, 2021. június 18., 18:23-n</title>
		<link rel="alternate" type="text/html" href="https://webarchivum.oszk.hu/mediawiki/index.php?title=Web-Harvest&amp;diff=1474&amp;oldid=prev"/>
		<updated>2021-06-18T18:23:28Z</updated>

		<summary type="html">&lt;p&gt;&lt;/p&gt;
&lt;table class=&quot;diff diff-contentalign-left&quot; data-mw=&quot;interface&quot;&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;tr class=&quot;diff-title&quot; lang=&quot;hu&quot;&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #222; text-align: center;&quot;&gt;← Régebbi változat&lt;/td&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #222; text-align: center;&quot;&gt;A lap 2021. június 18., 18:23-kori változata&lt;/td&gt;
				&lt;/tr&gt;&lt;tr&gt;
  &lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;5. sor:&lt;/td&gt;
  &lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;5. sor:&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&amp;#160;&lt;/td&gt;
  &lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;* [http://web-harvest.sourceforge.net/ A Web-Harvest weboldala]&lt;/div&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&amp;#160;&lt;/td&gt;
  &lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;* [http://web-harvest.sourceforge.net/ A Web-Harvest weboldala]&lt;/div&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&amp;#160;&lt;/td&gt;
  &lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;* [https://sourceforge.net/projects/web-harvest/ A Web-Harvest a SourceForge-on]&lt;/div&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&amp;#160;&lt;/td&gt;
  &lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;* [https://sourceforge.net/projects/web-harvest/ A Web-Harvest a SourceForge-on]&lt;/div&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;−&lt;/td&gt;
  &lt;td style=&quot;color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;* [&lt;del class=&quot;diffchange diffchange-inline&quot;&gt;Web Crawling with Web Harvest and Scala &lt;/del&gt;http://robust-project.eu/news/web-crawling-with-web-harvest-and-scala/]&lt;/div&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;+&lt;/td&gt;
  &lt;td style=&quot;color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;* [http://robust-project.eu/news/web-crawling-with-web-harvest-and-scala/&lt;ins class=&quot;diffchange diffchange-inline&quot;&gt; Web Crawling with Web Harvest and Scala&lt;/ins&gt;]&lt;/div&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&amp;#160;&lt;/td&gt;
  &lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&amp;#160;&lt;/td&gt;
  &lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&amp;#160;&lt;/td&gt;
  &lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;[[Category:SZOFTVEREK]]&lt;/div&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&amp;#160;&lt;/td&gt;
  &lt;td style=&quot;background-color: #f8f9fa; color: #222; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;[[Category:SZOFTVEREK]]&lt;/div&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;/table&gt;</summary>
		<author><name>Admin</name></author>
		
	</entry>
	<entry>
		<id>https://webarchivum.oszk.hu/mediawiki/index.php?title=Web-Harvest&amp;diff=1473&amp;oldid=prev</id>
		<title>Admin: Új oldal, tartalma: „2006-tól nagyjából 2013-ig fejlesztett, Java nyelven írt scraping eszköz, melynek egyes komponensei csővezetékszerűen összefűzhetők és így…”</title>
		<link rel="alternate" type="text/html" href="https://webarchivum.oszk.hu/mediawiki/index.php?title=Web-Harvest&amp;diff=1473&amp;oldid=prev"/>
		<updated>2021-06-18T18:23:08Z</updated>

		<summary type="html">&lt;p&gt;Új oldal, tartalma: „2006-tól nagyjából 2013-ig fejlesztett, Java nyelven írt &lt;a href=&quot;/mediawiki/index.php?title=Web_scraping&quot; title=&quot;Web scraping&quot;&gt;scraping&lt;/a&gt; eszköz, melynek egyes komponensei csővezetékszerűen összefűzhetők és így…”&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Új lap&lt;/b&gt;&lt;/p&gt;&lt;div&gt;2006-tól nagyjából 2013-ig fejlesztett, Java nyelven írt [[Web scraping|scraping]] eszköz, melynek egyes komponensei csővezetékszerűen összefűzhetők és így különböző adatokat és tartalmakat lehet kinyerni weboldalakból. A HTTP modul letölti a megadott URL-ekről a fájlokat, az HTML-to-XML konvertáló &amp;quot;megtisztított&amp;quot; XHTML formátumot állít elő belőlük a fölösleges részek eltávolításával, az XPath ki tudja gyűjteni a HTML kódból például a képfájlokra mutató linkeket, majd ezek listáját átadja a HTTP modulnak letöltés céljából... Számos szerkesztési műveletet is el lehet végezni a segítségével HTML és XML formátumú szöveges fájlokon. Széles körben ismert technológiákra támaszkodik (XSLT, XQuery, reguláris kifejezések), szkriptnyelveket is támogat (BeanShell, Groovy, Javascript), az egyes komponensek konfigurálása pedig XML fájlok formájában történik. &lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
&lt;br /&gt;
* [http://web-harvest.sourceforge.net/ A Web-Harvest weboldala]&lt;br /&gt;
* [https://sourceforge.net/projects/web-harvest/ A Web-Harvest a SourceForge-on]&lt;br /&gt;
* [Web Crawling with Web Harvest and Scala http://robust-project.eu/news/web-crawling-with-web-harvest-and-scala/]&lt;br /&gt;
&lt;br /&gt;
[[Category:SZOFTVEREK]]&lt;/div&gt;</summary>
		<author><name>Admin</name></author>
		
	</entry>
</feed>