robots.txt - Sivujen indeksointi hakukoneissa

Takaisin etusivulle | Mene loppuun

robots.txt tiedostolla tai metatageilla voi kieltää hakukoneita indeksoimasta haluttuja sivuja. Kaikki hakukoneet eivät kuitenkaan näitä noudata, mutta yleisimmät hakukoneet kyllä, kuten esim. www.google.fi
Yksinkertaisesti luot robots.txt tiedoston, jonka sisältö on seuraavanlainen:

User-Agent: *
Disallow: /

Ja lopuksi siirrä tiedosto kotisivusi juurihakemistoon, jossa sijaitseen myös aloitussivun tiedosto (kuten: index.html)

User-Agent rivi kertoo, mitä hakukoneita "käsky" koskee. Tähti (*) tarkoittaa kaikkia hakukoneita.
Disallow rivi taas kertoo kohteen, mitä ei indeksoida.
Esim. pelkkä Disallow: / estää koko sivustosi indeksoinnin kun taas Disallow: /testihakemisto/ estää vain testihakemistossa olevan materiaalin indeksoinnin.

Saman voi tehdä myös sivukohtaisesti metatagia käyttäen.
Yksinkertaisesti <HEAD> </HEAD> tagien väliin luo allaoleva rivi.

<META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">

Takaisin etusivulle | Palaa ylös

© 2005 - Petteri Hongisto

Valid HTML 4.01! Valid CSS!