Googlebot confusion des sous domaines serveur ou bot en folie?

WRInaute passionné
Bonjour,

voila, je n'ai rien touché, mais j'ai de plus en plus d'erreurs de crawl de google qui indexe des pages qui ne correspondent pas au répertoire ou elles se trouvent. Je retrouve ces erreurs par millier dans GWT, et dans mes logs.

Il m'attribue des pages par exemple nice.html ou cannes.html dans le répertoire et sous domaine 04-alpes-de-haute-provence.annuairefrancais.fr alors qu'il n'y a aucune page de ce nom dans ce répertoire.
ex dans les serps sur la requête "103 boulevard de la croisette 06 cannes" , mais il n'y a pas de cache sur le lien ...

Soit c'est une erreur du bot ou de la base, soit (je pense plutot) de mon serveur. Vu que c'est un dédié chez ovh et que je n'ai jamais eut cette erreur, et que je ne connais pas bien cette partie, je suis coincé. Je n'ai ni base sql, ni php, que je n'utilise que de l'HTML depuis des années, et les mêmes fichiers de config.

QQ1 a une idée? probleme sur fichier htaccess? cache du serveur corrompu (je le redemarre souvent). Le serveur tourne depuis 7 ans chez OVH sans broncher ... merci de votre aide ou piste.
 
WRInaute passionné
Nouveau up car je continus d'avoir des remontées d'erreurs 404 en masse, suite a des pages de sous domaines indexées et mélangées a d'autres sous domaines. Google a indexé des pages n'étants pas dans le répertoire du sous domaines mais d'un autre sous domaine, les mélangeants toutes, ce qui semble impossible, car ce ne sont que des pages statiques et le serveurs n'a pas été modifié depuis des années.

Ni l'analyse des logs http ni du serveur avec l'aide des techniciens d'OVH n'a pas permi de détecter des erreurs serveurs, ni comprendre pourquoi les pages du répertoire B se retrouvent indexées dans Google dans le répertoire A ou Z ...

Sur les caches Google, les datent varient de mai a juillet ...

Je vais finir par croire que soit le BOT a eut un bug (je doute car je ne serait pas seul dans ce cas), soit mon serveur a un bug sur des fichier .htaccess (je viens de le changer et partis sur un neuf et plus de fichier htaccess), soit du négative SEO sur des proxy intermédiaires (si cela est possible?).

Quelques exemples de pages dans Google (copier l'url dans la zone de recherche donnera l'index par google et le cache) :
-http://42-loire.annuairefrancais.fr/dentiste/boulogne-billancourt-5.html
-http://41-loir-et-cher.annuairefrancais.fr/dentiste/index-23.html
etc etc.

Je deviens parano du NSEO, même si l'incidence n'est pas importante (-10% de trafic), si quelqu'un a une idée ...merci d'avance.
 
Discussions similaires
Haut