Google ne respecte pas mon robots.txt!!!!
8 messages • Page 1 sur 1
Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics
Google ne respecte pas mon robots.txt!!!!
Google index les pages que je ne lui demande pas d'indexer dans le robots.txt:
http://www.google.fr/search?hl=fr&q=sit ... cher&meta=
Pour preuve, voici mon robots.txt:
-http://www.jeunautes.com/robots.txt
Que faire? La syntaxe de mon robots.txt est foireuse?
http://www.google.fr/search?hl=fr&q=sit ... cher&meta=
Pour preuve, voici mon robots.txt:
-http://www.jeunautes.com/robots.txt
Que faire? La syntaxe de mon robots.txt est foireuse?
La syntaxe du robots.txt à l'air correcte.
J'ai l'impression que Google n'indexe pas la page viewtopic.php, mais les pages viewtopic.php?id=xx
Il me semble que les expressions régulières ne sont pas autorisées dans un fichier robots.txt. A faire confirmer par le forum.
J'ai l'impression que Google n'indexe pas la page viewtopic.php, mais les pages viewtopic.php?id=xx
Il me semble que les expressions régulières ne sont pas autorisées dans un fichier robots.txt. A faire confirmer par le forum.
Re: Google ne respecte pas mon robots.txt!!!!
zimounet a écrit:Google index les pages que je ne lui demande pas d'indexer dans le robots.txt:
http://www.google.fr/search?hl=fr&q=sit ... cher&meta=
Bah elle ne sont pas indexés pour le moment, vu qu'il n'y a que l'url de pris en compte ! Maintenant a savoir s'il s'agit d'une desindexation de ces pages, ou un debut d'indexation ! Je ne peut pas confirmer...
Patience
Bonjour,
Je ne vois rien d'anormal. J'ai essayé d'expliquer ici : Le fichier robots.txt permet-il de supprimer une page d'un moteur de recherche ?.
"Ne pas visiter une page" n'est pas "ne pas référencer une page".
Jean-Luc
Je ne vois rien d'anormal. J'ai essayé d'expliquer ici : Le fichier robots.txt permet-il de supprimer une page d'un moteur de recherche ?.
"Ne pas visiter une page" n'est pas "ne pas référencer une page".
Jean-Luc
Voir dans les "autres sujets de discussion", j'y ai trouvé ce lien :
http://googleguy-fr.blogspot.com/2004/0 ... e-msn.html
http://googleguy-fr.blogspot.com/2004/0 ... e-msn.html
"Si une page est dans robots.txt, nous n'allons pas la crawler, mais nous pouvons l'afficher dans les résultats de recherche si nous avons des raisons de penser qu'elle est pertinente par rapport à la requête. Dans ce cas, nous n'afficherons que l'URL (pas de titre, pas de description et pas de cache).
Voici un bon exemple : pendant longtemps, le California Department of Motor Vehicles (DMV) avait un robots.txt qui ne laissait pas les moteurs crawler les pages. Seulement, pour une recherche comme "california dmv" nous pouvions retourner une URL, même si nous ne pouvions crawler la page.
Si tu ne veux pas que la page apparaissent du tout, tu peux le garantir en laissant Google voir la meta tag "noindex" lors du crawl.
Pour les curieux, nous avons réussi à convaincre DMV de laisser les moteurs crawler leur site, mais nous avons du prendre un rendez-vous et nous avons fait la queue pendant un moment.
ouais bah je le merde Mister google!
J'ai rewrité mes pages, et depuis le début je lui dis de pas les crawler!
Alors non seulement il me les crawl, et en plus il me les ajoute a son index!!!
Et apres il va pas etre content car il va dire que je fais du "duplicate content" naméo
En fait les pages qu'il m'index alors qu'il devrais pas si il suivait mon robots.txt sont en lien sur la page d'accueil (j'ai la fleme de rewriter les liens vers les last poste du forum)...
Bref, méchant le google, je boude!
J'ai rewrité mes pages, et depuis le début je lui dis de pas les crawler!
Alors non seulement il me les crawl, et en plus il me les ajoute a son index!!!
Et apres il va pas etre content car il va dire que je fais du "duplicate content" naméo
En fait les pages qu'il m'index alors qu'il devrais pas si il suivait mon robots.txt sont en lien sur la page d'accueil (j'ai la fleme de rewriter les liens vers les last poste du forum)...
Bref, méchant le google, je boude!
zimounet a écrit:En fait les pages qu'il m'index alors qu'il devrais pas si il suivait mon robots.txt sont en lien sur la page d'accueil
Je crois que tu n'as pas lu la réponse que jerome347 a donnée à ta question et qui confirmait ma réponse...
Jean-Luc
8 messages • Page 1 sur 1
Formation recommandée sur ce thème :
Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Sortie de GoogleStats v2.01
- Les crawlers de Yahoo!
- Les robots MSNbot de Live Search
- Googlebot, le robot d'indexation de Google
- Déclarer son fichier sitemap dans le fichier robots.txt
- Petit changement pour Slurp (le robot de Yahoo)
- Robots.txt : Yahoo supporte les options avancées
- La balise meta NOYDIR de Yahoo
- Comment gérer simplement les sitemaps de plusieurs sites au même endroit
- Alexa lance un moteur de recherche d'images
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités






le forum