Google ne respecte pas mon robots.txt!!!!

Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics

zimounet
WRInaute accro
WRInaute accro
 
Messages: 1796
Inscription: Lun Nov 08, 2004 20:57

Google ne respecte pas mon robots.txt!!!!

Message le Lun Déc 19, 2005 8:35

Google index les pages que je ne lui demande pas d'indexer dans le robots.txt:
http://www.google.fr/search?hl=fr&q=sit ... cher&meta=

Pour preuve, voici mon robots.txt:
-http://www.jeunautes.com/robots.txt

Que faire? La syntaxe de mon robots.txt est foireuse?

spidetra
WRInaute accro
WRInaute accro
 
Messages: 1500
Inscription: Lun Juil 07, 2003 13:06

Message le Lun Déc 19, 2005 10:02

La syntaxe du robots.txt à l'air correcte.

J'ai l'impression que Google n'indexe pas la page viewtopic.php, mais les pages viewtopic.php?id=xx

Il me semble que les expressions régulières ne sont pas autorisées dans un fichier robots.txt. A faire confirmer par le forum.


amokk
WRInaute passionné
WRInaute passionné
 
Messages: 762
Inscription: Lun Mai 09, 2005 15:10

Re: Google ne respecte pas mon robots.txt!!!!

Message le Lun Déc 19, 2005 10:09

zimounet a écrit:Google index les pages que je ne lui demande pas d'indexer dans le robots.txt:
http://www.google.fr/search?hl=fr&q=sit ... cher&meta=


Bah elle ne sont pas indexés pour le moment, vu qu'il n'y a que l'url de pris en compte ! Maintenant a savoir s'il s'agit d'une desindexation de ces pages, ou un debut d'indexation ! Je ne peut pas confirmer...

Patience ;)


jeanluc
WRInaute accro
WRInaute accro
 
Messages: 2659
Inscription: Lun Mai 03, 2004 14:48

Message le Lun Déc 19, 2005 10:11

Bonjour,

Je ne vois rien d'anormal. J'ai essayé d'expliquer ici : Le fichier robots.txt permet-il de supprimer une page d'un moteur de recherche ?.

"Ne pas visiter une page" n'est pas "ne pas référencer une page".

Jean-Luc


TOMHTML
WRInaute accro
WRInaute accro
 
Messages: 3243
Inscription: Mer Aoû 25, 2004 14:05

Message le Lun Déc 19, 2005 12:21

regarde ton interface Sitemaps sur google, tu verra la rubrique "URL restreintes par le fichier robots.txt" et au bout d'un moment les pages indexées disparaitront de l'index et apparaitront dans cette rubrique.


jerome347
WRInaute passionné
WRInaute passionné
 
Messages: 573
Inscription: Ven Mar 19, 2004 13:09

Message le Lun Déc 19, 2005 14:05

Voir dans les "autres sujets de discussion", j'y ai trouvé ce lien :
http://googleguy-fr.blogspot.com/2004/0 ... e-msn.html

"Si une page est dans robots.txt, nous n'allons pas la crawler, mais nous pouvons l'afficher dans les résultats de recherche si nous avons des raisons de penser qu'elle est pertinente par rapport à la requête. Dans ce cas, nous n'afficherons que l'URL (pas de titre, pas de description et pas de cache).
Voici un bon exemple : pendant longtemps, le California Department of Motor Vehicles (DMV) avait un robots.txt qui ne laissait pas les moteurs crawler les pages. Seulement, pour une recherche comme "california dmv" nous pouvions retourner une URL, même si nous ne pouvions crawler la page.
Si tu ne veux pas que la page apparaissent du tout, tu peux le garantir en laissant Google voir la meta tag "noindex" lors du crawl.
Pour les curieux, nous avons réussi à convaincre DMV de laisser les moteurs crawler leur site, mais nous avons du prendre un rendez-vous et nous avons fait la queue pendant un moment. ;-)

zimounet
WRInaute accro
WRInaute accro
 
Messages: 1796
Inscription: Lun Nov 08, 2004 20:57

Message le Lun Déc 19, 2005 14:39

ouais bah je le merde Mister google!

J'ai rewrité mes pages, et depuis le début je lui dis de pas les crawler!

Alors non seulement il me les crawl, et en plus il me les ajoute a son index!!!

Et apres il va pas etre content car il va dire que je fais du "duplicate content" naméo

En fait les pages qu'il m'index alors qu'il devrais pas si il suivait mon robots.txt sont en lien sur la page d'accueil (j'ai la fleme de rewriter les liens vers les last poste du forum)...

Bref, méchant le google, je boude!


jeanluc
WRInaute accro
WRInaute accro
 
Messages: 2659
Inscription: Lun Mai 03, 2004 14:48

Message le Lun Déc 19, 2005 14:50

zimounet a écrit:En fait les pages qu'il m'index alors qu'il devrais pas si il suivait mon robots.txt sont en lien sur la page d'accueil

Je crois que tu n'as pas lu la réponse que jerome347 a donnée à ta question et qui confirmait ma réponse... :wink:

Jean-Luc


Formation recommandée sur ce thème :

Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités