vosinformations.com

La balise meta robots

mardi 25 septembre 2007

Cette balise est à placer dans la partie <head> de chaque page, entre les balises <head> et </head>. Tout comme pour le fichier robots.txt, l’absence signifie autorisation.

4 possibilités sont offertes :

index indique aux robots qu’ils sont autorisés à indexer la page.
noindex interdit aux robots d’indexer la page.

follow leur indique qu’ils peuvent suivre les liens présents sur la page.
nofollow leur interdit de suivre les liens.

noarchive est un paramètre optionnel qui interdit aux moteurs de recherche de montrer la copie de la page archivée dans leurs caches, il suffit de le rajouter cette mention.
<meta name="robots" content="xxx,xxx,noarchive">
Cette configuration est indispensable en cas de cloaking.
Elle peut également être utile pour interdire la mise en cache d’une page modifiée très régulièrement.


1- index,follow est la valeur par défaut de cette balise.
Si elle est absente, les robots indexeront la page et suivront les liens.

Balise par défaut : indexer + suivre les liens
<meta name="robots" content="index,follow">
ou
<meta name="robots" content="follow">
ou
<meta name="robots" content="index">
ou
<meta name="robots" content="all">


2- noindex,follow : ne pas indexer + suivre les liens

<meta name="robots" content="noindex,follow">
ou
<meta name="robots" content="noindex">

Syntaxe utilisée en cas de bombing.


3- index,nofollow : indexer + ne pas suivre les liens

<meta name="robots" content="index,nofollow">
ou
<meta name="robots" content="nofollow">


4- noindex,nofollow : ne pas indexer + ne pas suivre les liens

<meta name="robots" content="noindex,nofollow">
ou
<meta name="robots" content="none">


La possibilité est offerte de placer une balise pour un robot particulier :

  • pour google : <meta name="googlebot" content="xxx,xxx">
  • pour msn : <meta name="msnbot" content="xxx,xxx">
  • pour yahoo : <meta name="y_key" content="xxx,xxx">

P.-S.

Un site avec un fichier robots.txt peut utiliser la balise meta robots dans les pages, les pages contenant la balise doivent être autorisée d’accès par robots.txt.
En effet, si le robot n’a pas l’autorisation de lire une page, il ne peut évidemment pas aller voir ce que dit la balise meta qui s’y trouve.

SPIP | | Plan du site | Suivre la vie du site RSS 2.0

Sauf mention contraire, le site est placé sous double licence Creative Commons BY-SA et GNU Free Documentation License.