GoogleBot perd la boule ???!!!
14 messages
• Page 1 sur 1
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
- kaizersoze10
- Nouveau WRInaute

- Messages: 35
- Inscription: 15 Fév 2008
GoogleBot perd la boule ???!!!
Alors là je ne comprends pas !!
Depuis quand le GoogleBot référence TOUTES les URL qu'il trouve sur une page alors que celles-ci ne sont pas accessibles "humainement" ? (cad qu'aucun lien ne renvoi vers ces URL !)
Je pensais jusqu'ici qu'il ne répertoriait que les URL qui apparaissaient dans des balises A (avec l'attribut HREF) car il est censé suivre le comportement d'une personne et répertorier les pages qui sont visitables !
En tapant sur google "site:www.exemple.com", je peux voir dans les résultats : que :
- example.com/flash/truc.swf (cette URL se trouve dans une balise EMBED que j'utilise pour faire apparaitre mon anim flash)
- example.com/inscription/ajax_traitement (cette URL apparait dans mon bouton (qui est une image) dans l'appel javascript "onClick" )
Essayez la manip' "site:votre site" sur Google et jeter un oeil a certaines URL, vous risquez d'etre aussi surpris ....
Comment empêcher ça ?
Y-a-t-il une technique avec les META ou le fichiers "robots.txt" ?
(actuellement, ma balise META est classique : <meta name="Robots" content="index,follow" />
et je n'ai pas de fichier "robots.txt")
Merci à tous ceux qui peuvent apporter une solution a ce gros probleme !
Depuis quand le GoogleBot référence TOUTES les URL qu'il trouve sur une page alors que celles-ci ne sont pas accessibles "humainement" ? (cad qu'aucun lien ne renvoi vers ces URL !)
Je pensais jusqu'ici qu'il ne répertoriait que les URL qui apparaissaient dans des balises A (avec l'attribut HREF) car il est censé suivre le comportement d'une personne et répertorier les pages qui sont visitables !
En tapant sur google "site:www.exemple.com", je peux voir dans les résultats : que :
- example.com/flash/truc.swf (cette URL se trouve dans une balise EMBED que j'utilise pour faire apparaitre mon anim flash)
- example.com/inscription/ajax_traitement (cette URL apparait dans mon bouton (qui est une image) dans l'appel javascript "onClick" )
Essayez la manip' "site:votre site" sur Google et jeter un oeil a certaines URL, vous risquez d'etre aussi surpris ....
Comment empêcher ça ?
Y-a-t-il une technique avec les META ou le fichiers "robots.txt" ?
(actuellement, ma balise META est classique : <meta name="Robots" content="index,follow" />
et je n'ai pas de fichier "robots.txt")
Merci à tous ceux qui peuvent apporter une solution a ce gros probleme !
-

bproductiv - WRInaute accro

- Messages: 4173
- Inscription: 27 Déc 2004
solutions: robots.txt ou .htaccess..
comme d'habitude quoi.
comme d'habitude quoi.
- kaizersoze10
- Nouveau WRInaute

- Messages: 35
- Inscription: 15 Fév 2008
Apparement, le fait que google affiche dans ses résultats des pages qui ne sont pas accessibles "normalement" ne vous choque pas ...
Le problème est que mes titres de pages affichées par ses URL est "erreur" car ce sont des pages (ou des fichiers) qui ont besoin de parametres PHP ... donc forcément un clic sur ce résultat renvoie sur une page d'erreur ...
Quoiqu'il en soit, ce n'est pas propre et pour, des raisons de sécurité également, j'aimerais que Google n'affiche jamais ces pages ...
Pouvez-vous me dire précisément qu'est-ce que je dois mettre dans mon "robots.txt" ou "htaccess" pour empecher Google d'afficher uniquement les liens qui sont dans des balises "<a href=...>"
Le problème est que mes titres de pages affichées par ses URL est "erreur" car ce sont des pages (ou des fichiers) qui ont besoin de parametres PHP ... donc forcément un clic sur ce résultat renvoie sur une page d'erreur ...
Quoiqu'il en soit, ce n'est pas propre et pour, des raisons de sécurité également, j'aimerais que Google n'affiche jamais ces pages ...
Pouvez-vous me dire précisément qu'est-ce que je dois mettre dans mon "robots.txt" ou "htaccess" pour empecher Google d'afficher uniquement les liens qui sont dans des balises "<a href=...>"
-

Røi - WRInaute occasionnel

- Messages: 469
- Inscription: 8 Aoû 2005
kaizersoze10 a écrit:Apparement, le fait que google affiche dans ses résultats des pages qui ne sont pas accessibles "normalement" ne vous choque pas ...![]()
Non Google fait ce qu'il veut c'est sa vie.
Le problème est que mes titres de pages affichées par ses URL est "erreur" car ce sont des pages (ou des fichiers) qui ont besoin de parametres PHP ... donc forcément un clic sur ce résultat renvoie sur une page d'erreur ...
Si c'est un site dynamique et ces liens n'ont pas à être affichés, tu ne peux pas mettre une condition pour les afficher dans le code ?
Pouvez-vous me dire précisément qu'est-ce que je dois mettre dans mon "robots.txt" ou "htaccess" pour empecher Google d'afficher uniquement les liens qui sont dans des balises "<a href=...>"
Cherche "disallow htaccess" dans google
Mais il n'existe pas une règle qui dit "ne prends pas les non a href" mais plutôt ne prends pas "cette url" apparemment l'url que tu ne veux pas voir indexée doit être indexée avec des paramètres, donc à toi de faire comme j'ai dis plus haut, une condition pour les afficher dans le code.
- kaizersoze10
- Nouveau WRInaute

- Messages: 35
- Inscription: 15 Fév 2008
Si c'est un site dynamique et ces liens n'ont pas à être affichés, tu ne peux pas mettre une condition pour les afficher dans le code ?
Qu'est-ce que vous entendez par là ?
Je suis obligé d'indiquer dans mon code source le répertoire où se trouve mon animation flash pour qu'il puisse l'afficher sur ma page ...
<embed src="../flash/counter.swf" ...
Cela ne veut pas dire pour autant que je veux que l'URL "www.exemple.com/flash/counter.swf" puisse être affichée dans les résultats Google !!
- kaizersoze10
- Nouveau WRInaute

- Messages: 35
- Inscription: 15 Fév 2008
Soit ...
Ca devrait aller avec le fichier "robots.txt" qui devrait bien m'aider à résoudre mon problème
Par contre je reste stupéfait par l'action du GoogleBot qui, pour moi, agissait comme un humain et affichait uniquement dans ses résultats les adresses des pages accessibles par clique sur des liens ...
Merci pour votre aide
Ca devrait aller avec le fichier "robots.txt" qui devrait bien m'aider à résoudre mon problème
Par contre je reste stupéfait par l'action du GoogleBot qui, pour moi, agissait comme un humain et affichait uniquement dans ses résultats les adresses des pages accessibles par clique sur des liens ...
Merci pour votre aide
-

UsagiYojimbo - WRInaute accro

- Messages: 8575
- Inscription: 23 Nov 2005
Le craw des sites effectué par Google n'est (heureusement pour eux) pas effectué par des être humains, mais par des robots qui parcourent le web de liens en liens.
Pour faire simple, si des liens sont affichés clairement dans ton code source, alors Google est en mesure d'indexer ce qu'il y a derrière.
Pour faire simple, si des liens sont affichés clairement dans ton code source, alors Google est en mesure d'indexer ce qu'il y a derrière.
- kaizersoze10
- Nouveau WRInaute

- Messages: 35
- Inscription: 15 Fév 2008
Puisqu'il n'y a que moi qui ai été choqué par cette découverte, je m'incline
Merci à tous pour vos réponses !
Merci à tous pour vos réponses !
- kaizersoze10
- Nouveau WRInaute

- Messages: 35
- Inscription: 15 Fév 2008
Euh ...
Je vais quand même faire les choses proprement histoire d'éviter tous risques de piratage ou autre ...
Des concurrents pourraient très bien essayer la commande "site:" !
Ne serait-ce qu'en terme d'image ça fait pas sérieux ...
Et, vu que c'est indexé, on ne sait jamais !
ces résultats aberrants pourraient très bien sortir sur je ne sais quelle requête !
Les voies de Google sont impénétrables ...
Je vais quand même faire les choses proprement histoire d'éviter tous risques de piratage ou autre ...
Des concurrents pourraient très bien essayer la commande "site:" !
Ne serait-ce qu'en terme d'image ça fait pas sérieux ...
Et, vu que c'est indexé, on ne sait jamais !
ces résultats aberrants pourraient très bien sortir sur je ne sais quelle requête !
Les voies de Google sont impénétrables ...
- Rv323
- WRInaute discret

- Messages: 145
- Inscription: 12 Avr 2007
Bonjour,
Pour éviter les piratage "blinder" le .swf afin qu'il ne puisse pas être lu ailleurs que sur ton site est certainement la meilleure chose à faire.
Quand à l'indexation de ces .swf un petit robots.txt n'est pas très compliqué à faire.
Aussi je ne vois pas pourquoi ceux-ci ressortiraient en aberration sur des requètes fantaisistes...
Pour éviter les piratage "blinder" le .swf afin qu'il ne puisse pas être lu ailleurs que sur ton site est certainement la meilleure chose à faire.
Quand à l'indexation de ces .swf un petit robots.txt n'est pas très compliqué à faire.
Aussi je ne vois pas pourquoi ceux-ci ressortiraient en aberration sur des requètes fantaisistes...
Dernière édition par Rv323 le Lun Déc 08, 2008 18:20, édité 1 fois.
-

tofm2 - WRInaute passionné

- Messages: 2202
- Inscription: 9 Avr 2005
Re: GoogleBot perd la boule ???!!!
kaizersoze10 a écrit:Je pensais jusqu'ici qu'il ne répertoriait que les URL qui apparaissaient dans des balises A (avec l'attribut HREF) car il est censé suivre le comportement d'une personne et répertorier les pages qui sont visitables !
non, googlebot scanne et indexe strictement tout ce qui ressemble de près ou de loin à une URL
http://www.netdynamics.eu/articles-main ... e-bot.html
14 messages
• Page 1 sur 1
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- La danse de Googlebot :-) La Google Dance
- Parts de marché des moteurs aux USA (Avril 2008)
- Parts de marché des moteurs aux USA (Mars 2008)
- Parts de marché des moteurs en France (Avril 2008)
- Parts de marché des moteurs en France (Juillet 2008)
- Parts de marché des moteurs en France (Juin 2008)
- Etude de Googlebot, le robot d'indexation de Google
Consultez la description détaillée des produits ou services de Google suivants : Googlebot
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités

