<?xml 
version="1.0" encoding="utf-8"?>
<rss version="2.0" 
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
>

<channel xml:lang="fr">
	<title>vosinformations.com</title>
	<link>http://www.vosinformations.com/</link>
	
	<language>fr</language>
	<generator>SPIP - www.spip.net</generator>




<item xml:lang="fr">
		<title>La balise meta robots</title>
		<link>http://www.vosinformations.com/La-balise-meta-robots.html</link>
		<guid isPermaLink="true">http://www.vosinformations.com/La-balise-meta-robots.html</guid>
		<dc:date>2007-09-25T14:04:45Z</dc:date>
		<dc:format>text/html</dc:format>
		<dc:language>fr</dc:language>
		<dc:creator>vince</dc:creator>


		<dc:subject>robots.txt</dc:subject>
		<dc:subject>index</dc:subject>
		<dc:subject>noindex</dc:subject>
		<dc:subject>follow</dc:subject>
		<dc:subject>nofollow</dc:subject>
		<dc:subject>noarchive</dc:subject>
		<dc:subject>Disallow</dc:subject>

		<description>&lt;p&gt;La balise meta robots permet d'autoriser ou d'interdire aux robots d'indexer une page web.&lt;/p&gt;

-
&lt;a href="http://www.vosinformations.com/-robots-txt,11-.html" rel="directory"&gt;robots.txt&lt;/a&gt;

/ 
&lt;a href="http://www.vosinformations.com/+-robots-txt-+.html" rel="tag"&gt;robots.txt&lt;/a&gt;, 
&lt;a href="http://www.vosinformations.com/+-index-+.html" rel="tag"&gt;index&lt;/a&gt;, 
&lt;a href="http://www.vosinformations.com/+-noindex-+.html" rel="tag"&gt;noindex&lt;/a&gt;, 
&lt;a href="http://www.vosinformations.com/+-follow-+.html" rel="tag"&gt;follow&lt;/a&gt;, 
&lt;a href="http://www.vosinformations.com/+-nofollow-+.html" rel="tag"&gt;nofollow&lt;/a&gt;, 
&lt;a href="http://www.vosinformations.com/+-noarchive-+.html" rel="tag"&gt;noarchive&lt;/a&gt;, 
&lt;a href="http://www.vosinformations.com/+-Disallow-+.html" rel="tag"&gt;Disallow&lt;/a&gt;

		</description>


 <content:encoded>&lt;div class='rss_chapo'&gt;&lt;p&gt;Cette balise est &#224; placer dans la partie &lt;span class='csfoo htmla'&gt;&lt;/span&gt;&lt;code class='spip_code' dir='ltr'&gt;&lt;head&gt;&lt;/code&gt;&lt;span class='csfoo htmlb'&gt;&lt;/span&gt; de chaque page, entre les balises &lt;span class='csfoo htmla'&gt;&lt;/span&gt;&lt;code class='spip_code' dir='ltr'&gt;&lt;head&gt; et &lt;/head&gt;&lt;/code&gt;&lt;span class='csfoo htmlb'&gt;&lt;/span&gt;.
Tout comme pour le fichier robots.txt, l'absence signifie autorisation.&lt;/p&gt;&lt;/div&gt;
		&lt;div class='rss_texte'&gt;&lt;p&gt;4 possibilit&#233;s sont offertes :&lt;/p&gt; &lt;p&gt;&lt;strong&gt;index&lt;/strong&gt; indique aux robots qu'ils sont autoris&#233;s &#224; indexer la page. &lt;br /&gt;&lt;strong&gt;noindex&lt;/strong&gt; interdit aux robots d'indexer la page.&lt;/p&gt; &lt;p&gt;&lt;strong&gt;follow&lt;/strong&gt; leur indique qu'ils peuvent suivre les liens pr&#233;sents sur la page. &lt;br /&gt;&lt;strong&gt;nofollow&lt;/strong&gt; leur interdit de suivre les liens.&lt;/p&gt; &lt;p&gt;&lt;strong&gt;noarchive&lt;/strong&gt; est un param&#232;tre optionnel qui interdit aux moteurs de recherche de montrer la copie de la page archiv&#233;e dans leurs caches, il suffit de le rajouter cette mention.
&lt;br /&gt;&lt;span class='csfoo htmla'&gt;&lt;/span&gt;&lt;code class='spip_code' dir='ltr'&gt;&lt;meta name=&quot;robots&quot; content=&quot;xxx,xxx,noarchive&quot;&gt;&lt;/code&gt;&lt;span class='csfoo htmlb'&gt;&lt;/span&gt;
&lt;br /&gt;Cette configuration est indispensable en cas de cloaking.
&lt;br /&gt;Elle peut &#233;galement &#234;tre utile pour interdire la mise en cache d'une page modifi&#233;e tr&#232;s r&#233;guli&#232;rement.&lt;/p&gt; &lt;hr class=&quot;spip&quot; /&gt;
&lt;p&gt;1- &lt;strong&gt;index,follow&lt;/strong&gt; est la valeur par &lt;strong&gt;d&#233;faut&lt;/strong&gt; de cette balise. &lt;br /&gt;Si elle est absente, les robots indexeront la page et suivront les liens.&lt;/p&gt; &lt;p&gt;Balise par d&#233;faut : indexer + suivre les liens
&lt;br /&gt;&lt;span class='csfoo htmla'&gt;&lt;/span&gt;&lt;code class='spip_code' dir='ltr'&gt;&lt;meta name=&quot;robots&quot; content=&quot;index,follow&quot;&gt;&lt;/code&gt;&lt;span class='csfoo htmlb'&gt;&lt;/span&gt;
&lt;br /&gt;ou
&lt;br /&gt;&lt;span class='csfoo htmla'&gt;&lt;/span&gt;&lt;code class='spip_code' dir='ltr'&gt;&lt;meta name=&quot;robots&quot; content=&quot;follow&quot;&gt;&lt;/code&gt;&lt;span class='csfoo htmlb'&gt;&lt;/span&gt;
&lt;br /&gt;ou
&lt;br /&gt;&lt;span class='csfoo htmla'&gt;&lt;/span&gt;&lt;code class='spip_code' dir='ltr'&gt;&lt;meta name=&quot;robots&quot; content=&quot;index&quot;&gt;&lt;/code&gt;&lt;span class='csfoo htmlb'&gt;&lt;/span&gt;
&lt;br /&gt;ou
&lt;br /&gt;&lt;span class='csfoo htmla'&gt;&lt;/span&gt;&lt;code class='spip_code' dir='ltr'&gt;&lt;meta name=&quot;robots&quot; content=&quot;all&quot;&gt;&lt;/code&gt;&lt;span class='csfoo htmlb'&gt;&lt;/span&gt;&lt;/p&gt; &lt;hr class=&quot;spip&quot; /&gt;
&lt;p&gt;2- &lt;strong&gt;noindex,follow&lt;/strong&gt; : ne pas indexer + suivre les liens&lt;/p&gt; &lt;p&gt;&lt;span class='csfoo htmla'&gt;&lt;/span&gt;&lt;code class='spip_code' dir='ltr'&gt;&lt;meta name=&quot;robots&quot; content=&quot;noindex,follow&quot;&gt;&lt;/code&gt;&lt;span class='csfoo htmlb'&gt;&lt;/span&gt;
&lt;br /&gt;ou
&lt;br /&gt;&lt;span class='csfoo htmla'&gt;&lt;/span&gt;&lt;code class='spip_code' dir='ltr'&gt;&lt;meta name=&quot;robots&quot; content=&quot;noindex&quot;&gt;&lt;/code&gt;&lt;span class='csfoo htmlb'&gt;&lt;/span&gt;&lt;/p&gt; &lt;p&gt;Syntaxe utilis&#233;e en cas de bombing.&lt;/p&gt; &lt;hr class=&quot;spip&quot; /&gt;
&lt;p&gt;3- &lt;strong&gt;index,nofollow&lt;/strong&gt; : indexer + ne pas suivre les liens&lt;/p&gt; &lt;p&gt;&lt;span class='csfoo htmla'&gt;&lt;/span&gt;&lt;code class='spip_code' dir='ltr'&gt;&lt;meta name=&quot;robots&quot; content=&quot;index,nofollow&quot;&gt;&lt;/code&gt;&lt;span class='csfoo htmlb'&gt;&lt;/span&gt;
&lt;br /&gt;ou
&lt;br /&gt;&lt;span class='csfoo htmla'&gt;&lt;/span&gt;&lt;code class='spip_code' dir='ltr'&gt;&lt;meta name=&quot;robots&quot; content=&quot;nofollow&quot;&gt;&lt;/code&gt;&lt;span class='csfoo htmlb'&gt;&lt;/span&gt;&lt;/p&gt; &lt;hr class=&quot;spip&quot; /&gt;
&lt;p&gt;4- &lt;strong&gt;noindex,nofollow&lt;/strong&gt; : ne pas indexer + ne pas suivre les liens&lt;/p&gt; &lt;p&gt;&lt;span class='csfoo htmla'&gt;&lt;/span&gt;&lt;code class='spip_code' dir='ltr'&gt;&lt;meta name=&quot;robots&quot; content=&quot;noindex,nofollow&quot;&gt;&lt;/code&gt;&lt;span class='csfoo htmlb'&gt;&lt;/span&gt;
&lt;br /&gt;ou
&lt;br /&gt;&lt;span class='csfoo htmla'&gt;&lt;/span&gt;&lt;code class='spip_code' dir='ltr'&gt;&lt;meta name=&quot;robots&quot; content=&quot;none&quot;&gt;&lt;/code&gt;&lt;span class='csfoo htmlb'&gt;&lt;/span&gt;&lt;/p&gt; &lt;hr class=&quot;spip&quot; /&gt;
&lt;p&gt;La possibilit&#233; est offerte de placer une balise pour un robot particulier :&lt;/p&gt; &lt;ul class=&quot;spip&quot;&gt;&lt;li&gt; pour google : &lt;span class='csfoo htmla'&gt;&lt;/span&gt;&lt;code class='spip_code' dir='ltr'&gt;&lt;meta name=&quot;googlebot&quot; content=&quot;xxx,xxx&quot;&gt;&lt;/code&gt;&lt;span class='csfoo htmlb'&gt;&lt;/span&gt;&lt;/li&gt;&lt;li&gt; pour msn : &lt;span class='csfoo htmla'&gt;&lt;/span&gt;&lt;code class='spip_code' dir='ltr'&gt;&lt;meta name=&quot;msnbot&quot; content=&quot;xxx,xxx&quot;&gt;&lt;/code&gt;&lt;span class='csfoo htmlb'&gt;&lt;/span&gt;&lt;/li&gt;&lt;li&gt; pour yahoo : &lt;span class='csfoo htmla'&gt;&lt;/span&gt;&lt;code class='spip_code' dir='ltr'&gt;&lt;meta name=&quot;y_key&quot; content=&quot;xxx,xxx&quot;&gt;&lt;/code&gt;&lt;span class='csfoo htmlb'&gt;&lt;/span&gt;&lt;/li&gt;&lt;/ul&gt;&lt;/div&gt;
		&lt;div class='rss_ps'&gt;&lt;p&gt;Un site avec un fichier robots.txt peut utiliser la balise &lt;strong&gt;meta robots&lt;/strong&gt; dans les pages, les pages contenant la balise doivent &#234;tre autoris&#233;e d'acc&#232;s par robots.txt.
&lt;br /&gt;En effet, si le robot n'a pas l'autorisation de lire une page, il ne peut &#233;videmment pas aller voir ce que dit la balise meta qui s'y trouve.&lt;/p&gt;&lt;/div&gt;
		</content:encoded>


		

	</item>
<item xml:lang="fr">
		<title>Sitemap dans robots.txt</title>
		<link>http://www.vosinformations.com/Sitemap-dans-robots-txt.html</link>
		<guid isPermaLink="true">http://www.vosinformations.com/Sitemap-dans-robots-txt.html</guid>
		<dc:date>2007-09-24T20:19:15Z</dc:date>
		<dc:format>text/html</dc:format>
		<dc:language>fr</dc:language>
		<dc:creator>vince</dc:creator>


		<dc:subject>robots.txt</dc:subject>
		<dc:subject>sitemap</dc:subject>

		<description>&lt;p&gt;Syntaxe de d&#233;claration du sitemap dans le fichier robots.txt&lt;/p&gt;

-
&lt;a href="http://www.vosinformations.com/-robots-txt,11-.html" rel="directory"&gt;robots.txt&lt;/a&gt;

/ 
&lt;a href="http://www.vosinformations.com/+-robots-txt-+.html" rel="tag"&gt;robots.txt&lt;/a&gt;, 
&lt;a href="http://www.vosinformations.com/+-sitemap-+.html" rel="tag"&gt;sitemap&lt;/a&gt;

		</description>


 <content:encoded>&lt;div class='rss_chapo'&gt;&lt;p&gt;Paradoxal, car sitemap.xml reprend la cartographie compl&#232;te de l'indexation voulue du site, tandis que robots.txt reprends la totalit&#233; des &#233;l&#233;ments dont le r&#233;f&#233;rencement n'est pas souhait&#233;... L'eau et le feu.&lt;/p&gt;&lt;/div&gt;
		&lt;div class='rss_texte'&gt;&lt;p&gt;Soumettre son sitemap directement &#224; l'indexation des robots de moteur de recherche est possible depuis d&#233;but 2007.&lt;/p&gt; &lt;p&gt;La syntaxe est la suivante :&lt;/p&gt; &lt;p&gt;&lt;strong&gt;Plan Sitemap :&lt;/strong&gt; &lt;strong&gt;emplacement_Sitemap&lt;/strong&gt;&lt;/p&gt; &lt;p&gt;ce qui donne :&lt;/p&gt; &lt;p&gt;&lt;a href='http://www.monsite.fr/sitemap.xml' class='spip_out' rel='nofollow'&gt;http://www.monsite.fr/sitemap.xml&lt;/a&gt;&lt;/p&gt; &lt;p&gt;Sur ce site, c'est :&lt;/p&gt; &lt;p&gt;&lt;a href='http://www.vosinformations.com/sitemap.xml' class='spip_out' rel='nofollow'&gt;http://www.vosinformations.com/site...&lt;/a&gt;&lt;/p&gt; &lt;hr class=&quot;spip&quot; /&gt;
&lt;p&gt;Apparemment la d&#233;claration de sitemap dans robots.txt est ind&#233;pendante de la ligne user-agent et l'insertion n'est pas soumise &#224; contrainte, sauf &#224; respecter la syntaxe propos&#233;e et surtout que l'adresse soit valide.
&lt;br /&gt;Conseil est chaudement recommand&#233; de tester son adresse sitemap avant soumission, un essai dans le navigateur prends un temps de copier-coller.&lt;/p&gt; &lt;p&gt;L'&lt;a href='http://www.sitemaps.org/fr/protocol.php#submit_robots' class='spip_out'&gt;article&lt;/a&gt; concernant cette &#233;volution dans la documentation du protocole sitemap.&lt;/p&gt;&lt;/div&gt;
		&lt;div class='rss_ps'&gt;&lt;p&gt;L'adresse compl&#232;te est mentionn&#233;e, contrairement aux fichiers robots o&#249; l'adresse est relative, &#224; partir de la racine du site.&lt;/p&gt;&lt;/div&gt;
		</content:encoded>


		

	</item>
<item xml:lang="fr">
		<title>Fichiers robots.txt &#224; t&#233;l&#233;charger.</title>
		<link>http://www.vosinformations.com/Fichiers-robots-txt-telecharger.html</link>
		<guid isPermaLink="true">http://www.vosinformations.com/Fichiers-robots-txt-telecharger.html</guid>
		<dc:date>2007-09-24T20:17:42Z</dc:date>
		<dc:format>text/html</dc:format>
		<dc:language>fr</dc:language>
		<dc:creator>vince</dc:creator>


		<dc:subject>robots.txt</dc:subject>

		<description>Quelques cas simples pr&#234;ts &#224; l'emploi. Dans ce premier fichier tout est autoris&#233;, les robots peuvent visiter et indexer librement votre site. Dans le second fichier, au contraire, vous ne d&#233;sirez ni la visite ni le r&#233;f&#233;rencement dans les moteurs de recherche, aucun robot n'est autoris&#233; &#224; parcourir votre espace. Dans le troisi&#232;me fichier, vous autorisez l'acc&#232;s libre &#224; l'int&#233;gralit&#233; de votre site &#224; tous les robots, sauf &#224; ceux qui ne respectent pas les contenus visit&#233;s, et qui sont parfois plus des (...)

-
&lt;a href="http://www.vosinformations.com/-robots-txt,11-.html" rel="directory"&gt;robots.txt&lt;/a&gt;

/ 
&lt;a href="http://www.vosinformations.com/+-robots-txt-+.html" rel="tag"&gt;robots.txt&lt;/a&gt;

		</description>


 <content:encoded>&lt;div class='rss_chapo'&gt;&lt;p&gt;Quelques cas simples pr&#234;ts &#224; l'emploi.&lt;/p&gt;&lt;/div&gt;
		&lt;div class='rss_texte'&gt;&lt;p&gt;Dans ce premier fichier tout est autoris&#233;, les robots peuvent visiter et indexer librement votre site.&lt;/p&gt; &lt;hr class=&quot;spip&quot; /&gt;
&lt;p&gt;Dans le second fichier, au contraire, vous ne d&#233;sirez ni la visite ni le r&#233;f&#233;rencement dans les moteurs de recherche, aucun robot n'est autoris&#233; &#224; parcourir votre espace.&lt;/p&gt; &lt;hr class=&quot;spip&quot; /&gt;
&lt;p&gt;Dans le troisi&#232;me fichier, vous autorisez l'acc&#232;s libre &#224; l'int&#233;gralit&#233; de votre site &#224; tous les robots, sauf &#224; ceux qui ne respectent pas les contenus visit&#233;s, et qui sont parfois plus des robots d' &quot;aspiration&quot; de contenu que des robots d'exploration et d'indexation.&lt;/p&gt;&lt;/div&gt;
		&lt;div class='rss_ps'&gt;&lt;p&gt;Contactez moi pour toute pr&#233;cision suppl&#233;mentaire ou d&#233;sir de fichier.&lt;/p&gt;&lt;/div&gt;
		</content:encoded>


		
		<enclosure url="http://www.vosinformations.com/sites/vosinformations.com/www/IMG/zip/robots.txt_autoriser_tout.zip" length="174" type="application/zip" />
		
		<enclosure url="http://www.vosinformations.com/sites/vosinformations.com/www/IMG/zip/robots.txt_autoriser_sauf_inderisable.zip" length="1417" type="application/zip" />
		
		<enclosure url="http://www.vosinformations.com/sites/vosinformations.com/www/IMG/zip/robots.txt_inderdire_tout.zip" length="176" type="application/zip" />
		

	</item>
<item xml:lang="fr">
		<title>robots.txt</title>
		<link>http://www.vosinformations.com/robots-txt,5.html</link>
		<guid isPermaLink="true">http://www.vosinformations.com/robots-txt,5.html</guid>
		<dc:date>2007-09-24T20:17:32Z</dc:date>
		<dc:format>text/html</dc:format>
		<dc:language>fr</dc:language>
		<dc:creator>vince</dc:creator>



		<description>Le fichier robots.txt est un fichier texte contenant des commandes &#224; destination des robots d'indexation des moteurs de recherche (google, yahoo...) afin de leur pr&#233;ciser les pages qui peuvent ou ne peuvent pas &#234;tre index&#233;es. Les moteurs de recherches scrutent en permanence le web &#224; la recherche de nouveaux sites et de nouvelles pages &#224; visiter et indexer, pour permettre de r&#233;pondre aux recherches des utilisateurs. En plus de visiter les innombrables nouveaut&#233;s qui leur sont propos&#233;s, ils (...)

-
&lt;a href="http://www.vosinformations.com/-robots-txt,11-.html" rel="directory"&gt;robots.txt&lt;/a&gt;


		</description>


 <content:encoded>&lt;div class='rss_chapo'&gt;&lt;p&gt;Le fichier &lt;strong&gt;robots.txt&lt;/strong&gt; est un fichier texte contenant des commandes &#224; destination des robots d'indexation des moteurs de recherche (google, yahoo...) afin de leur pr&#233;ciser les pages qui peuvent ou ne peuvent pas &#234;tre index&#233;es.&lt;/p&gt;&lt;/div&gt;
		&lt;div class='rss_texte'&gt;&lt;p&gt;Les moteurs de recherches scrutent en permanence le web &#224; la recherche de nouveaux sites et de nouvelles pages &#224; visiter et indexer, pour permettre de r&#233;pondre aux recherches des utilisateurs.
&lt;br /&gt;En plus de visiter les innombrables nouveaut&#233;s qui leur sont propos&#233;s, ils recherchent aussi les espaces qui n'ont pas sollicit&#233; leur inscription.
&lt;br /&gt;Pour diverses raisons, certaines de vos pages peuvent &#234;tre confidentielles, ou en tous cas votre objectif n'est pas de les diffuser largement sur les moteurs .
De la m&#234;me mani&#232;re, un site ou une page en construction ne doivent pas &#234;tre la cible d'une telle aspiration.
&lt;br /&gt;C'est l&#224; qu'intervient le fichier &lt;strong&gt;robots.txt&lt;/strong&gt;, pr&#233;sent sur votre serveur et qui donnera des indications de comportement et mentionnera les interdictions de visites enti&#232;res ou partielles que vous aurez indiqu&#233;es.
Idem pour un site en mutation ou d&#233;m&#233;nagement, si un r&#233;pertoire ou un fichier est supprim&#233; ou est d&#233;plac&#233;, il convient de le renseigner dans le fichiers &lt;strong&gt;robots.txt&lt;/strong&gt; pour qu'il ne soit plus cherch&#233;, les robots revisitent p&#233;riodiquement les pages index&#233;es pour les remettre &#224; jour.&lt;/p&gt; &lt;p&gt;Les moteurs de recherche utilisent un robot d&#233;nomm&#233; &lt;i&gt;spider&lt;/i&gt; (araign&#233;e) ou &lt;i&gt;crawler&lt;/i&gt; pour parcourir et indexer la toile.
&lt;br /&gt;Lorsqu'il scrute un site nouveau (trouv&#233; ou propos&#233;), le robot cherche en premier lieu ce fichier qui se trouve &#224; la racine du site.
&lt;br /&gt;Si l'adresse de votre site est &lt;a href='http://www.monsite.fr/' class='spip_out' rel='nofollow'&gt;http://www.monsite.fr/&lt;/a&gt; le spider cherchera, en premier lieu, d&#232;s son arriv&#233;e sur le site &lt;a href='http://www.monsite.fr/robots.txt' class='spip_out' rel='nofollow'&gt;http://www.monsite.fr/robots.txt&lt;/a&gt;
Pr&#233;cision importante, il doit imp&#233;rativement se trouver &#224; cet endroit et il ne peut y en avoir qu'un par site.&lt;/p&gt; &lt;p&gt;Si ce fichier existe, il le lit et se conforme au indications qui y sont inscrites.
&lt;br /&gt;S'il ne le trouve pas il effectue son travail de lecture et de sauvegarde de la page qu'il est venu visiter, consid&#233;rant qu'a priori rien ne lui est interdit.
&lt;br /&gt;C'est le principe d'indexation, tout est permis &#8211; acc&#232;s libre comme n'importe quel internaute &#8211; sauf restriction du webmaster.&lt;/p&gt; &lt;p&gt;Le fichier &lt;strong&gt;robots.txt&lt;/strong&gt; (minuscules et au pluriel) est un fichier ASCII.&lt;/p&gt; &lt;p&gt;Il est conseill&#233; d'utiliser un &#233;diteur de texte tel que le Bloc-notes, NotePad...
&lt;br /&gt;Des programmes comme Word sont utilisables, mais avec pr&#233;caution, car ils rajoutent &#8211; sauvagement &#8211; des codes invisibles et le fichier sauv&#233; sur le serveur peut parfois ne pas &#234;tre au format ASCII pur.&lt;/p&gt; &lt;p&gt;La structure d'un fichier robots.txt est la suivante, le fichier est compos&#233; des deux instructions suivantes :&lt;/p&gt; &lt;p&gt;&lt;img src=&quot;http://www.vosinformations.com/sites/vosinformations.com/www/local/cache-vignettes/L8xH11/puce-ed6e1.gif&quot; width='8' height='11' class='puce' alt=&quot;-&quot; style='height:11px;width:8px;' /&gt; &lt;strong&gt;User-Agent&lt;/strong&gt; : nom du robot, permet de pr&#233;ciser le robot concern&#233; par les directives suivantes.
La valeur &lt;strong&gt;*&lt;/strong&gt; signifie tous les moteurs de recherche.&lt;/p&gt; &lt;p&gt;&lt;img src=&quot;http://www.vosinformations.com/sites/vosinformations.com/www/local/cache-vignettes/L8xH11/puce-ed6e1.gif&quot; width='8' height='11' class='puce' alt=&quot;-&quot; style='height:11px;width:8px;' /&gt; &lt;strong&gt;Disallow&lt;/strong&gt; : permet d'indiquer les pages &#224; exclure de l'indexation. Chaque page ou chemin &#224; exclure est sur une ligne &#224; part et doit commencer par &lt;strong&gt;/&lt;/strong&gt; La valeur &lt;strong&gt;/&lt;/strong&gt; toute seule, sans autre indication qui suit, signifie toutes les pages du site.&lt;/p&gt; &lt;hr class=&quot;spip&quot; /&gt;
&lt;ul class=&quot;spip&quot;&gt;&lt;li&gt; Exclusion de toutes les pages : aucune visite ou indexation n'est autoris&#233;e, tout est interdit.&lt;/li&gt;&lt;/ul&gt;
&lt;p&gt;&lt;strong&gt;User-Agent : *&lt;/strong&gt;
&lt;br /&gt;&lt;strong&gt;Disallow : /&lt;/strong&gt;&lt;/p&gt; &lt;hr class=&quot;spip&quot; /&gt;
&lt;ul class=&quot;spip&quot;&gt;&lt;li&gt; Exclusion d'aucune page , toutes les pages sont visit&#233;es :&lt;/li&gt;&lt;/ul&gt;
&lt;p&gt;&lt;strong&gt;User-Agent : *&lt;/strong&gt;
&lt;br /&gt;&lt;strong&gt;Disallow :&lt;/strong&gt;&lt;/p&gt; &lt;p&gt;&lt;i&gt;Cela revient &#224; l'absence de fichier robots.txt, ils sont libre de parcourir et d'indexer.&lt;/i&gt;&lt;/p&gt; &lt;hr class=&quot;spip&quot; /&gt;
&lt;ul class=&quot;spip&quot;&gt;&lt;li&gt; Autorisation d'un seul robot : &lt;/li&gt;&lt;/ul&gt;
&lt;p&gt;&lt;strong&gt;User-Agent : nomDuRobot&lt;/strong&gt;
&lt;br /&gt;&lt;strong&gt;Disallow :&lt;/strong&gt;&lt;/p&gt; &lt;p&gt;&lt;strong&gt;User-Agent : *&lt;/strong&gt;
&lt;br /&gt;&lt;strong&gt;Disallow : /&lt;/strong&gt;&lt;/p&gt; &lt;p&gt;&lt;i&gt;La premi&#232;re consigne permet au &#171; nomDuRobot &#187; de visiter le site complet, la seconde interdit la visite &#224; tous les autres. L'ordre est de la syntaxe est importante le robot &#171; nomDuRobot &#187; est autoris&#233;, les autres interdits, si l'ordre est invers&#233;, &#171; nomDuRobot &#187; ne parviendrait pas &#224; la seconde indication, car il se sera arr&#234;t&#233; &#224; la premi&#232;re interdiction g&#233;n&#233;rale et quittera le site. (Principe de l'entonnoir)
&lt;/i&gt;&lt;/p&gt; &lt;hr class=&quot;spip&quot; /&gt;
&lt;ul class=&quot;spip&quot;&gt;&lt;li&gt; Exclusion d'un robot : &lt;/li&gt;&lt;/ul&gt;
&lt;p&gt;&lt;strong&gt;User-Agent : NomDuRobot&lt;/strong&gt;
&lt;br /&gt;&lt;strong&gt;Disallow : /&lt;/strong&gt;&lt;/p&gt; &lt;p&gt;&lt;strong&gt;User-Agent : *&lt;/strong&gt;
&lt;br /&gt;&lt;strong&gt;Disallow :&lt;/strong&gt;&lt;/p&gt; &lt;p&gt;&lt;i&gt;M&#234;me remarque que l'exemple pr&#233;c&#233;dent, dans un premier temps un robot particulier est exclu, dans un second, temps, les autres sont autoris&#233;s.
&lt;/i&gt;&lt;/p&gt; &lt;hr class=&quot;spip&quot; /&gt;
&lt;ul class=&quot;spip&quot;&gt;&lt;li&gt; Exclusion d'une page en particulier :&lt;/li&gt;&lt;/ul&gt;
&lt;p&gt;&lt;strong&gt;User-Agent : *&lt;/strong&gt;
&lt;br /&gt;&lt;strong&gt;Disallow : /repertoire/chemin/page.html&lt;/strong&gt;&lt;/p&gt; &lt;p&gt;&lt;i&gt;L'adresse du fichier est indiqu&#233;e de mani&#232;re relative, &#224; partir de la racine du site, l'adresse de l'exemple pr&#233;c&#233;dent serait &lt;a href='http://monsite.fr/repertoire/chemin/page.html' class='spip_out' rel='nofollow'&gt;http://monsite.fr/repertoire/chemin...&lt;/a&gt;
&lt;/i&gt;&lt;/p&gt; &lt;hr class=&quot;spip&quot; /&gt;
&lt;ul class=&quot;spip&quot;&gt;&lt;li&gt; Exclusion de toutes les pages d'un r&#233;pertoire et ses sous-dossiers : &lt;/li&gt;&lt;/ul&gt;
&lt;p&gt;&lt;strong&gt;User-Agent : *&lt;/strong&gt;
&lt;br /&gt;&lt;strong&gt;Disallow : /repertoire/&lt;/strong&gt;&lt;/p&gt; &lt;hr class=&quot;spip&quot; /&gt;
&lt;ul class=&quot;spip&quot;&gt;&lt;li&gt; Interdire l'acc&#232;s &#224; tous les robots au r&#233;pertoire /Dormir (donc &lt;a href='http://monsite.fr/Dormir/' class='spip_out' rel='nofollow'&gt;http://monsite.fr/Dormir/&lt;/a&gt;) :&lt;/li&gt;&lt;/ul&gt;
&lt;p&gt;&lt;strong&gt;User-Agent : *&lt;/strong&gt;
&lt;br /&gt;&lt;strong&gt;Disallow : /Dormir/&lt;/strong&gt;&lt;/p&gt; &lt;hr class=&quot;spip&quot; /&gt;
&lt;ul class=&quot;spip&quot;&gt;&lt;li&gt; Interdire l'acc&#232;s &#224; tous les robots dans le r&#233;pertoire /dormir, du fichier Bcp.hmtl (donc &lt;a href='http://monsite.fr/Dormir/Bcp.html' class='spip_out' rel='nofollow'&gt;http://monsite.fr/Dormir/Bcp.html&lt;/a&gt;) :&lt;/li&gt;&lt;/ul&gt;
&lt;p&gt;&lt;strong&gt;User-Agent : *&lt;/strong&gt;
&lt;br /&gt;&lt;strong&gt;Disallow : /Dormir/Bcp.html&lt;/strong&gt;&lt;/p&gt; &lt;hr class=&quot;spip&quot; /&gt;
&lt;p&gt;Remarques :&lt;/p&gt; &lt;p&gt;Respectez la casse (majuscules et minuscules) des ordres et de vox fichiers : &lt;strong&gt;Disallow&lt;/strong&gt; (et non disallow) /Dormir (et /non dormir).&lt;/p&gt; &lt;p&gt;L'&#233;criture des ordres est &lt;strong&gt;Disallow :&lt;/strong&gt; sans espace entre Disallow et :, puis &lt;strong&gt;1]&lt;/strong&gt; espace entre &lt;strong&gt;Disallow :&lt;/strong&gt; et la suite.&lt;/p&gt; &lt;p&gt;Pas de ligne vide entre deux ordres, pour espacer vous pouvez vous servir de &lt;strong&gt;#&lt;/strong&gt; pour incr&#233;menter la ligne et commenter la ligne (utile pour se souvenir d'un ordre).
Toute erreur de syntaxe, sera interpr&#233;t&#233;e comme une absence de fichiers &lt;strong&gt;robots.txt&lt;/strong&gt; et donc une autorisation de parcourir et d'indexer.&lt;/p&gt; &lt;p&gt;Voici l'exemple du &lt;a href='http://www.vosinformations.com/robots.txt' class='spip_out'&gt;fichier &lt;strong&gt;robots.txt&lt;/strong&gt; du site&lt;/a&gt;&lt;/p&gt;&lt;/div&gt;
		&lt;div class='rss_ps'&gt;&lt;p&gt;Portez une attention particuli&#232;re &#224; l'orthographe, d'abord du nom du fichier, il doit &#234;tre &#233;crit en minuscules &lt;strong&gt;robots.txt&lt;/strong&gt; (et non ROBOTS.TXT).
&lt;br /&gt;Attention &#233;galement au &quot;s&quot;, robots.txt (et non robot.txt).
&lt;br /&gt;En cas d'erreur, le fichier est tout simplement ignor&#233; et la libert&#233; de l'automate totale.&lt;/p&gt; &lt;p&gt;Si le webmaster veut par exemple interdire l'acc&#232;s au dossier cgi-bin (sur le serveur), alors que c'est Cgi-bin qui est renseign&#233;, l'acc&#232;s au dossier cgi-bin est autoris&#233; au robot, qui pourra s'y rendre.&lt;/p&gt;&lt;/div&gt;
		</content:encoded>


		

	</item>



</channel>

</rss>
