Robot cherchant des pages qui n'existent pas sur mon site
5 messages
• Page 1 sur 1
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
- teusch
- Nouveau WRInaute

- Messages: 3
- Inscription: 4 Nov 2005
Robot cherchant des pages qui n'existent pas sur mon site
je m'occupe d'un site internet alpiski.com
j'ai pu remarquer une augmentation de mon fichier error_log.
Apres une étude de ce fichier je me suis apercu qu'un robot cherchait des pages inexistantes et n'ayant jamais existées sur mon site.
j'ai pris la page recherchée je l'ai recherchée dans google et la j'ai un résultat etrange, comme si google se mélangeait pas les pinceaux entre plusieurs url
la page en cache avec mon url n'a rien avoir avec mon site.
Détails :
Mon site : alpiski.com
une ligne par exemple du fichier error_log : [Thu Nov 3 18:54:02 2005] [error] [client 66.249.72.2] File does not exist: /var/www/html/serrechevalier1350/Concert_20050514_Calendrier_ville.html
La recherche dans google de "Concert_20050514_Calendrier_ville.html" donne en résultat 2 pages :
Babylon Circus Gentleman Tiken Jah Fakoly Sinsemilia Le peuple de ...
espaceconcert.com annonce artistes, concerts, festivals, discographies, photos,
[url]serrechevalier1350.alpiski.com/ Concert_20050514_Calendrier_ville.html[/url]- 594k - Résultat complémentaire - En cache - Pages similaires
Babylon Circus Gentleman Tiken Jah Fakoly Sinsemilia Le peuple de ...
espaceconcert.com annonce artistes, concerts, festivals, discographies, photos,
http://www.itop-conseil.com/Concert_%2020050514_Calendrier_ville.html- 587k - Résultat complémentaire - En cache - Pages similaires
les pages dans le cache de google qui date du 12 aout n'ont rien avoir avec mon site.
Avez vous une explication. Merci
j'ai pu remarquer une augmentation de mon fichier error_log.
Apres une étude de ce fichier je me suis apercu qu'un robot cherchait des pages inexistantes et n'ayant jamais existées sur mon site.
j'ai pris la page recherchée je l'ai recherchée dans google et la j'ai un résultat etrange, comme si google se mélangeait pas les pinceaux entre plusieurs url
la page en cache avec mon url n'a rien avoir avec mon site.
Détails :
Mon site : alpiski.com
une ligne par exemple du fichier error_log : [Thu Nov 3 18:54:02 2005] [error] [client 66.249.72.2] File does not exist: /var/www/html/serrechevalier1350/Concert_20050514_Calendrier_ville.html
La recherche dans google de "Concert_20050514_Calendrier_ville.html" donne en résultat 2 pages :
Babylon Circus Gentleman Tiken Jah Fakoly Sinsemilia Le peuple de ...
espaceconcert.com annonce artistes, concerts, festivals, discographies, photos,
[url]serrechevalier1350.alpiski.com/ Concert_20050514_Calendrier_ville.html[/url]- 594k - Résultat complémentaire - En cache - Pages similaires
Babylon Circus Gentleman Tiken Jah Fakoly Sinsemilia Le peuple de ...
espaceconcert.com annonce artistes, concerts, festivals, discographies, photos,
http://www.itop-conseil.com/Concert_%2020050514_Calendrier_ville.html- 587k - Résultat complémentaire - En cache - Pages similaires
les pages dans le cache de google qui date du 12 aout n'ont rien avoir avec mon site.
Avez vous une explication. Merci
-

jeanluc - WRInaute accro

- Messages: 3062
- Inscription: 3 Mai 2004
Bonjour teusch,
J'ai déjà vu ça quelque part. J'ai eu le même problème avec plusieurs sites. Google t'attribue des pages hébergées par d'autres serveurs à la même adresse IP.
Peux-tu demander à ton hébergeur quel système il utilise pour gérer les domaines virtuels ? Dans le cas de mon hébergeur, c'était Sphera VDS (Virtual Dedicated Server).
Selon Google, le problème est chez l'hébergeur. Selon mon hébergeur, le problème est lié à l'emploi de Sphera. Seuls les robots de Google ont ce problème de confusion de sites à la même IP.
Peux-tu me tenir au courant ?
Jean-Luc
J'ai déjà vu ça quelque part. J'ai eu le même problème avec plusieurs sites. Google t'attribue des pages hébergées par d'autres serveurs à la même adresse IP.
Peux-tu demander à ton hébergeur quel système il utilise pour gérer les domaines virtuels ? Dans le cas de mon hébergeur, c'était Sphera VDS (Virtual Dedicated Server).
Selon Google, le problème est chez l'hébergeur. Selon mon hébergeur, le problème est lié à l'emploi de Sphera. Seuls les robots de Google ont ce problème de confusion de sites à la même IP.
Peux-tu me tenir au courant ?
Jean-Luc
-

jeanluc - WRInaute accro

- Messages: 3062
- Inscription: 3 Mai 2004
Le problème n'est pas résolu et il n'est pas aussi bénin qu'il y paraît. Il a des conséquences sérieuses :
- des pages d'autres sites sont affichées par Google comme appartenant à ton site (éventuellement des pages de sites adultes ou d'autres sites qui ne correspondent pas à l'image de ton site);
- certaines visites de Googlebot à des pages de ton site provoquent une erreur 404, car elles sont traitées par un autre serveur web à la même adresse. Google peut en conclure que ton site contient un nombre anormalement élevé de liens brisés et désindexer certaines de ces adresses ou punir globalement ton site pour cela.
Pour éviter le problème, l'hébergeur peut désactiver l'option "Keep Alive" pour tous les domaines à cette adresse (mais cela entraînerait une importante baisse de performance du serveur) ou attribuer une adresse IP particulière à ton domaine (ce qui fait en sorte qu'il ne sera plus confondu avec les autres). Evidemment une solution venant de Sphera serait préférable. Ils sont au courant du problème depuis des mois, mais jusqu'à présent, ils ne semblent pas en mesure de le résoudre.
Jean-Luc
- des pages d'autres sites sont affichées par Google comme appartenant à ton site (éventuellement des pages de sites adultes ou d'autres sites qui ne correspondent pas à l'image de ton site);
- certaines visites de Googlebot à des pages de ton site provoquent une erreur 404, car elles sont traitées par un autre serveur web à la même adresse. Google peut en conclure que ton site contient un nombre anormalement élevé de liens brisés et désindexer certaines de ces adresses ou punir globalement ton site pour cela.
Pour éviter le problème, l'hébergeur peut désactiver l'option "Keep Alive" pour tous les domaines à cette adresse (mais cela entraînerait une importante baisse de performance du serveur) ou attribuer une adresse IP particulière à ton domaine (ce qui fait en sorte qu'il ne sera plus confondu avec les autres). Evidemment une solution venant de Sphera serait préférable. Ils sont au courant du problème depuis des mois, mais jusqu'à présent, ils ne semblent pas en mesure de le résoudre.
Jean-Luc
5 messages
• Page 1 sur 1
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Bingbot : le nom officiel du robot de Bing - 29-06-2010
- Petit changement pour Slurp (le robot de Yahoo) - 29-03-2007
- Sortie officielle de GoogleStats v2.0 ! - 23-02-2003
- Sortie de GoogleStats v2.01 - 02-03-2003
- Etude de Googlebot, le robot d'indexation de Google - 30-07-2002
- Yahoo! se moque de Google - 07-08-2004
- Référencement : le problème des sessions des pages PHP - 04-08-2008
- Les Smart Answers arrivent chez Ask France - 12-04-2006
Consultez la description détaillée des produits ou services de Google suivants : Google Feed Fetcher, Googlebot
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités
