SEO - Jak funguje a k čemu slouží soubor ROBOTS.TXT
Soubor ROBOTS.TXT je obyčejný textový dokument, umístěný v kořenovém adresáři domény, který musí mít následující zápis:
User-agent: *
Disallow: /cgi-bin/
Položka User-agent definuje název robota a položka Disallow definuje část webu, která má být robotem ignorována.
Zápis může vypadat i takto:
User-agent: *
Disallow: /cgi-bin/
Disallow: /images/
Disallow: /osobni/
Výše uvedený zápis tedy říká všem robotům (*), aby neindexovali adresáře /cgi-bin /images a /osobni.
Zápis ale může vypadat i následovně
User-agent: Bar
Disallow: /cg
Disallow: /im
Disallow: /os
User-agent: Foo
Disallow: /
Tento zápis říká, že robot "Bar" nesmí indexovat soubory, nebo adresáře začínající písmeny cg,im nebo os. Zápis je ekvivalentní předchozímu. Robot tedy nebude indexovat adresáře /cgi-bin, /images nebo /osobni. Sousně deklaruje, že robot "Foo" nemá indexovat stránky vůbec. Odřádkování mezi oběma deklaracemi je povinné.
Je důležité dát si pozor, neboť do souboru robots.txt má přístup v podstatě každý, kdo zadá adresu www.mojedomena.cz/robots.txt. Soubor obsahuje položky, které robot ignoruje, ale člověk nemusí! Takto se může stát, že se kdokoli může podívat do adresáře vámi deklarovaného v souboru robots.txt. Proto pamatujte na důskedné zabezpečení případných administračních skriptů! V tomto případě je na místě říci následující - soubor ROBOTS.TXT slouží pouze pro deklaraci adresářů, které nemají být indexovány robotem vyhledávače, nikoli však pro ukrytí adresářů či souborů před zobrazením. Obecná poučka říká, že CO NECHCI ZVEŘEJŇOVAT - NEDÁVÁM NA INTERNET, nebo to alespoň řádně zabezpečím přístupovými právy.
Soubor ROBOTS.TXT není jediná možnost jak deklarovat části webu, které nemají být indexovány. Každá stránka totiž může obsahovat meta tag..
..který určuje zda-li má být stránka vyhledávačem indexována a procházena znovu. V položce content, můžou být následující hodnoty 
- index - indexovat stránku
- noindex - neindexovat stránku
- follow - vracet se na stránku
- nofollow - nechodit zpět na stránku
Další zdroje:
Yuhůůova stránka o vyhledávačích
Robotstxt.org
Robots.txt tutorial
Komentáře
Ostatní články
- Nové produktové balíčky pro redakční systém (22.03.2009)
- Redesign www stránek (10.03.2008)
- Instalace APACHE, PHP a MySQL snadno a rychle! (08.03.2007)
- Tvorba internetových stránek pro obecní úřady a školy ZDARMA (29.01.2007)
- Komprimace JavaScriptu (18.07.2006)
- SEO - Jak funguje a k čemu slouží soubor ROBOTS.TXT (30.09.2004)
- P2P (Peer to Peer) - sdílení dat pomocí Bittorrent protokolu (29.09.2004)
- Jak najít na internetu práci aneb volná pracovní místa nejen v ČR (23.09.2004)
- Zajímavý link : 486 Games - staré hry (17.09.2004)
- SKYPE - Telefonujeme přes internet (15.09.2004)

