„Crawler-friendly website” változatai közötti eltérés

Innen: MIA
 
(2 közbenső módosítás ugyanattól a szerkesztőtől nincs mutatva)
8. sor: 8. sor:
 
* jól konfigurált [[robots txt|robots.txt]], amely beengedi a robotokat, de csak a tényleges tartalmat szolgáltató, ill. számukra optimalizált részekre
 
* jól konfigurált [[robots txt|robots.txt]], amely beengedi a robotokat, de csak a tényleges tartalmat szolgáltató, ill. számukra optimalizált részekre
   
A [[crawler]]-barát site-ok kialakítására vonatkozó szabályok ill. ajánlások elsősorban [[SEO]]-szempontból íródtak, vagyis a keresőgépek robotjai számára való optimalizálásra vonatkoznak. Ezek nagyrészt az archiválási célból indított robotok esetében is hasznosak, de az archiválás esetében más szempontok is vannak (lásd: [[archive-friendly website]]\).
+
A [[crawler]]-barát site-ok kialakítására vonatkozó szabályok ill. ajánlások elsősorban [[SEO]]-szempontból íródtak, vagyis a keresőgépek robotjai számára való optimalizálásra vonatkoznak. Ezek nagyrészt az archiválási célból indított robotok esetében is hasznosak, de az archiválás esetében más szempontok is vannak (lásd: [[archive-friendly website]]).
   
 
----
 
----
14. sor: 14. sor:
 
* [https://moz.com/beginners-guide-to-seo/basics-of-search-engine-friendly-design-and-development The Basics of SEO Friendly Design and Development]
 
* [https://moz.com/beginners-guide-to-seo/basics-of-search-engine-friendly-design-and-development The Basics of SEO Friendly Design and Development]
 
* [https://www.clickz.com/the-anatomy-of-a-crawler-friendly-web-page/84901/ Mike Grehan: The Anatomy of a Crawler Friendly Web Page]
 
* [https://www.clickz.com/the-anatomy-of-a-crawler-friendly-web-page/84901/ Mike Grehan: The Anatomy of a Crawler Friendly Web Page]
  +
* [http://www.webarchive.org.uk/ukwa/info/technical Making Your Website Crawler-Friendly]
   
 
[[Category:FOGALMAK]]
 
[[Category:FOGALMAK]]

A lap jelenlegi, 2018. március 18., 17:30-kori változata

Olyan kialakítású webhely, amelynek releváns tartalma könnyen és teljesen felderíthető robotokkal, az érdektelen (pl. naplófájlok, segédállományok) vagy lementhetetlen (pl. adatbázisok, webáruházak) részei viszont el vannak rejtve előlük. Például ilyen megoldásokkal tehető bejárhatóbbá egy webszerver tartalma:

  • honlaptérkép (lehetőleg XML-ben), amely minden lényeges aloldalra elvezeti a robotot
  • a tartalom értékes része nincs túl mélyen a kezdőlapról indulva és linkeken keresztül is elérhető, nem csak egy keresőűrlapon át
  • szabályos HTML linkek a Javascript-, Flash-, Java-alapú stb. megoldások helyett/mellett, amelyeket a robot is követni tud
  • az azonos tartalomra mutató sokféle belső link, vagy a végtelen körben egymásra hivatkozó linkek kerülése vagy kanonizálása a robotok számára
  • frame-ek, egérkattintásra aktiválódó layerek, dinamikusan generálódó tartalmak elkerülése, vagy legalább statikus és önálló URL címekkel rendelkező alternatívák generálása ezekből a robotok számára
  • jól konfigurált robots.txt, amely beengedi a robotokat, de csak a tényleges tartalmat szolgáltató, ill. számukra optimalizált részekre

A crawler-barát site-ok kialakítására vonatkozó szabályok ill. ajánlások elsősorban SEO-szempontból íródtak, vagyis a keresőgépek robotjai számára való optimalizálásra vonatkoznak. Ezek nagyrészt az archiválási célból indított robotok esetében is hasznosak, de az archiválás esetében más szempontok is vannak (lásd: archive-friendly website).