robots.txt – Sivujen indeksointi hakukoneissa

robots.txt tiedostolla tai metatageilla voi kieltää hakukoneita indeksoimasta haluttuja sivuja. Kaikki hakukoneet eivät kuitenkaan näitä noudata, mutta yleisimmät hakukoneet kyllä, kuten esim. Google ja Bing.
Yksinkertaisesti luot robots.txt tiedoston, jonka sisältö on seuraavanlainen:

User-Agent: *
Disallow: /

Ja lopuksi siirrä tiedosto kotisivusi juurihakemistoon, jossa sijaitseen myös aloitussivun tiedosto (kuten: index.html)

User-Agent rivi kertoo, mitä hakukoneita “käsky” koskee. Tähti (*) tarkoittaa kaikkia hakukoneita.
Disallow rivi taas kertoo kohteen, mitä ei indeksoida.
Esim. pelkkä Disallow: / estää koko sivustosi indeksoinnin kun taas Disallow: /testihakemisto/ estää vain testihakemistossa olevan materiaalin indeksoinnin.

Saman voi tehdä myös sivukohtaisesti metatagia käyttäen.
Yksinkertaisesti <HEAD> </HEAD> tagien väliin luo allaoleva rivi.

<META NAME=”ROBOTS” CONTENT=”NOINDEX, NOFOLLOW”>

Leave a Reply

Your email address will not be published. Required fields are marked *

*