Utilisation du fichier robots.txt

Règles du forum
Attention ce forum est destiné avant tout à ceux qui découvrent le référencement. Les membres qui auront l'amabilité de répondre à leurs questions sont priés de rester courtois, polis, indulgents, patients et pédagogues... Merci d'avance !

Par ailleurs, inutile d'utiliser ce forum uniquement pour obtenir des liens vers vos sites, les liens sont désactivés pour le référencement (nofollow).

Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics


tibashoult
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 5
Inscription: 16 Juin 2008

Utilisation du fichier robots.txt

Message le Mar Aoû 05, 2008 14:44

Bonjour tous le monde

J'ai une question pour les fortiches du site !

Sur mon site, Google m'a indexé des pages html que je ne désire pas plus que ça... je voulais savoir si avec mon fichier robots.txt je pouvais exclure un répertoire, mais que Google continue d'indexer des pages qui sont dans ce répertoire (inscritent dans mon sitemap.xml).

En fait, je ne développe quand html, et pour afficher des images, j'utilise des petits fichier html, qui ne servent qu'à cela. Il n'y a donc pas d'intérêt de les indexer.

Dans mon fichier robots.txt j'ai ces 2 lignes :
Disallow: /Rep1/
Sitemap: http://mon site/Sitemap.xml

dans le fichier Sitemap.xml; j'ai cette ligne
<url>
<loc>http://mon site/Rep1/page.html</loc>
<lastmod>2008-07-07</lastmod>
<priority>0.5</priority>
<changefreq>monthly</changefreq>
</url>

Malgré l'interdiction du répertoire, est ce que ma page sera quand même indexée dans Google (sans erreur ou avertissement d'URL bloqué par exemple).

Merci pour vos réponse ! :wink:


HawkEye
WRInaute accro
WRInaute accro
 
Messages: 17005
Inscription: 23 Fév 2004

Message le Mar Aoû 05, 2008 23:48

Non, si tu Disallow: /Rep1/, tous les documents situés sous ./Rep1/ sont rendus non-indexables (y-compris "Rep1/Rep2/*").


jeanluc
WRInaute accro
WRInaute accro
 
Messages: 3049
Inscription: 3 Mai 2004

Message le Mer Aoû 06, 2008 6:42

D'accord avec HawkEye, mais ces pages n'ont rien à faire dans ton sitemap. Déjà qu'un sitemap exact n'a pas beaucoup d'intérêt, je ne vois pas ce que tu espères d'un sitemap incorrect.

Jean-Luc


tibashoult
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 5
Inscription: 16 Juin 2008

Message le Mer Aoû 06, 2008 8:09

HawkEye a écrit:Non, si tu Disallow: /Rep1/, tous les documents situés sous ./Rep1/ sont rendus non-indexables (y-compris "Rep1/Rep2/*").


Merci HawkEye

En fouillant un peu partout j'arrive à la même conclusion. Je vais plutôt utiliser la fonction meta pour indiquer de ne pas suivre les liens ! Je pense que se sera plus efficace.

La balise <META NAME="ROBOTS" CONTENT="INDEX, NOFOLLOW"> est elle respectée par les robots (google et yahoo...)

Merci


Si vous avez aimé cette discussion, partagez-la sur vos réseaux sociaux préférés :

Formation recommandée sur ce thème :

Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: hamoudi et 0 invités