URLs introuvables dans les outils pour les webmasters Google

Nouveau WRInaute
Bonjour,

J'ai récemment migré de ForumActif pour passer sur phpBB, grosse galère puisque ForumActif ne fournit aucun accès à la BDD et ne donne pas de backup, mais j'ai pu tout récupérer.

Ce n'est pas là le problème, mais cette migration a forcément imposé des changements d'URL de tous les topics (impossible de les conserver malheureusement). Donc chute de trafic totale, logique, je m'y attendais. Il faut savoir que mon forum a plus de 148 000 messages et 7200 sujets.
J'ai évidemment effectué des redirections dans le fichier .htaccess, mais seulement pour les sujets les plus consultés : 1000 redirections tout de même.

Puis les choses se sont arrangées, mais ça fait un moment que je stagne à environ 1/3 de mon trafic d'avant. La cause est surement que Google continue de buter sur les anciennes URL, car il me trouve 128 000 URLs introuvables dans les outils pour les webmasters, et une centaine de plus chaque jour, ça ne cesse d'augmenter donc. Une capture d'écran ci besoin : http://www.cjoint.com/14nv/DKklLBQdori_erreurs_google.png

Évidemment, je ne peux pas effectuer 128 000 redirections pour 2 raisons simples : cela me prendrait un temps de fou, et puis cela alourdirait considérablement le fichier .htaccess, qui l'est déjà pas mal avec 1000 redirections.

Normalement, la seule chose à faire est d'attendre que Google comprenne. Toutefois, je poste ici pour recueillir d'autres avis :
1/ Est-ce que vous pensez que Google va finir par comprendre ? Si vous avez déjà eu affaire à cela, savez-vous combien de temps cela risque de prendre ? Car ça fait plus d'un mois et ça continue d'augmenter.
2/ Il n'y a pas tout simplement un moyen de lui demander d'arrêter de buter là-dessus ? J'ai cherché, mais rien trouvé...

Si besoin l'URL de mon site est celle de mon profil.

Merci par avance pour vos réponses :)

Gabriel.
 
WRInaute accro
2011N2 a dit:
Évidemment, je ne peux pas effectuer 128 000 redirections pour 2 raisons simples : cela me prendrait un temps de fou, et puis cela alourdirait considérablement le fichier .htaccess, qui l'est déjà pas mal avec 1000 redirections.
Si les ID des topics n'ont pas changés, tu peux faire ça en PHP.
 
Nouveau WRInaute
Re,

On a tenté énormément de choses en php avec les URLs pour que cela ne donne pas de 404 même si ce sont les mêmes ID, mais malheureusement à chaque fois ça buggait.

Mais à vrai dire, ce n'est pas un gros problème qu'elles soient différentes, car s'il reste de sites externes renvoient vers des 404, je le vois dans les stats et rajoute une redirection dans le .htaccess.

Le seul truc est que je ne sais pas comment Google pourrait oublier les anciennes URLs... Surement avec le temps mais c'est étrange que ça progresse de jour en jour surtout.

Gabriel.
 
WRInaute accro
Si tu es parti d'un scrap / export de ta base de donnée initiale et si tu as les mêmes ID, ca n'a pas été possible de procéder avec une table de correspondance ? ce qui évite toute gestion via la .htaccess et se fait somme tout assez rapidement ?
 
Nouveau WRInaute
Re,

Non justement, ça a été extrêmement complexe : sur mon hébergeur initial, ForumActif je n'avais AUCUN accès à la BDD, à rien du tout en fait.

On a été obligé de faire passer un script qui passait sur tous les sujets et membres pour les récupérer. Une BDD faite maison quoi... Pour ça que les URL c'était pas possible.

Gabriel.
 
WRInaute accro
2011N2 a dit:
On a été obligé de faire passer un script qui passait sur tous les sujets et membres pour les récupérer

Bein je comprends pas du coup pourquoi, étant donné qu'il avait crawler, ne pas avoir récupéré l'url également.

Mais même sans cela, dans un topic PHPBB, voire dans un sous-forum, les id sont présents dans les div qui encadrent le contenu. Rien qu'avec l'id, en connaissant la nomenclature des url du CMS, c'est jouable de mettre au point un script qui détecte l'ancien schéma, isole l'id et redirige sur la nouvelle page équivalente.
 
WRInaute impliqué
2011N2 a dit:
Le seul truc est que je ne sais pas comment Google pourrait oublier les anciennes URLs... Surement avec le temps mais c'est étrange que ça progresse de jour en jour surtout.

des messages sans mise à jour depuis des années, google ne va pas les vérifier tous les jours, c'est donc normal que cela progresse au fur et à mesure qu'il vérifie ces urls.
 
Nouveau WRInaute
Re,

Bein je comprends pas du coup pourquoi, étant donné qu'il avait crawler, ne pas avoir récupéré l'url également.

Mais même sans cela, dans un topic PHPBB, voire dans un sous-forum, les id sont présents dans les div qui encadrent le contenu. Rien qu'avec l'id, en connaissant la nomenclature des url du CMS, c'est jouable de mettre au point un script qui détecte l'ancien schéma, isole l'id et redirige sur la nouvelle page équivalente.

Probable qu'il existe une solution, mais tout ce qu'on a essayé de "classique" n'a pas fonctionné, le reste demandait un énorme boulot, et avec déjà toutes les galères qu'on a eu pour cette migration, pas trop eu le courage.

des messages sans mise à jour depuis des années, google ne va pas les vérifier tous les jours, c'est donc normal que cela progresse au fur et à mesure qu'il vérifie ces urls.

Oui à mon avis ce n'est qu'une question de temps, c'était surtout pour savoir si c'était possible de signaler à Google que les URL introuvables répertoriées n'existent plus, pour gagner du temps.

Gabriel.
 
Nouveau WRInaute
Re,

Oui c'est ce que je fais, je suis attentif aux 404, notamment à cause des liens présents sur d'autres sites, ou même en interne.

Gabriel.
 
Discussions similaires
Haut