Googlebot remplis les formulaires !

WRInaute passionné
Surprise ce matin en regardant googlesats
Je retrouve une page avec comme paramètre une adresse mail et la page d'inscription à ma maillingliste.
Et lorsque je regarde les logs de ma mailingliste, je retrouve certaines adresses inscrites en double, dont une provenant de googlebot avec comme host crawler1.googlebot.com.

Je ne comprends pas comment le bot récupère les adresses mail pour les soumettre sauf si google par un moyen ou un autre (la toolbar) conserve toutes les pages de navigation.

kmacleod
 
WRInaute impliqué
Je ne sais pas si le phénomène est à rapprocher de ce que tu constates, mais de mon coté GG référence des URL avec paramètres présentes uniquement dans des liens en javascript sur mes pages:

Par exemple dans page.php, il existe un lien javascript vers page.php?destinataire=toto

Du coup, ça met la grouille dans GG. Souvent page.php?destinataire=toto est proposé dans les réponses de GG au détriment de page.php
Du coup mes visiteurs se retrouvent avec un formulaire pré-rempli en arrivant sur mon site alors que ça n'a pas lieu d'être.

Bref, j'avais volontairement mis ces liens en javascript pensant que GG ne le suivrait pas.
C'est raté! A cause de la GGbar :?:
 
Olivier Duffez (admin)
Membre du personnel
avez-vous regardé de quelle version de GoogleBot il s'agit ?
car attention au MediaPartner (le bot de AdSense), il vient indexer toutes les URL que les internautes vont voir...
 
WRInaute passionné
Code:
64.68.86.15 crawler1.googlebot.com 
64.68.86.149 crawler4.googlebot.com
googlebot ou médiapartnerbot je retrouve les deux mêmes informations dans googlestats avec les deux bots
Il serait alors possible qu'avec la toolbar toutes les url soient récupérées.
Les internautes qui utilisent le formulaire avec les toolbar seraient alors "pistés".

J'ai modifié mon formulaire pour éviter celà, mais la source du problème demeure.

kmacleod
 
Olivier Duffez (admin)
Membre du personnel
Dans GoogleStats (ou RobotStats), il faut créer 2 robots, détectés par le user agent, pour les distinguer.
Sinon le coup de la visite de GoogleBot suite à la toolbar, je n'ai pas encore vu ça je crois. Par contre, les pages sont-elles trouvables sur Google ?
 
WRInaute passionné
Peut-être une piste entre mediapartner(sur le site) et toolbar (chez l'internaute)
J'avais un doublon coté détection par googlebot (par IP !) donc les infos proviennent bien du bot adsense

kmacleod
 
Discussions similaires
Haut