Messages: 16

Enregistré le: 22 Oct 2013

Message le Lun Nov 10, 2014 12:38

Bonjour,

J'ai récemment migré de ForumActif pour passer sur phpBB, grosse galère puisque ForumActif ne fournit aucun accès à la BDD et ne donne pas de backup, mais j'ai pu tout récupérer.

Ce n'est pas là le problème, mais cette migration a forcément imposé des changements d'URL de tous les topics (impossible de les conserver malheureusement). Donc chute de trafic totale, logique, je m'y attendais. Il faut savoir que mon forum a plus de 148 000 messages et 7200 sujets.
J'ai évidemment effectué des redirections dans le fichier .htaccess, mais seulement pour les sujets les plus consultés : 1000 redirections tout de même.

Puis les choses se sont arrangées, mais ça fait un moment que je stagne à environ 1/3 de mon trafic d'avant. La cause est surement que Google continue de buter sur les anciennes URL, car il me trouve 128 000 URLs introuvables dans les outils pour les webmasters, et une centaine de plus chaque jour, ça ne cesse d'augmenter donc. Une capture d'écran ci besoin : http://www.cjoint.com/14nv/DKklLBQdori_erreurs_google.png

Évidemment, je ne peux pas effectuer 128 000 redirections pour 2 raisons simples : cela me prendrait un temps de fou, et puis cela alourdirait considérablement le fichier .htaccess, qui l'est déjà pas mal avec 1000 redirections.

Normalement, la seule chose à faire est d'attendre que Google comprenne. Toutefois, je poste ici pour recueillir d'autres avis :
1/ Est-ce que vous pensez que Google va finir par comprendre ? Si vous avez déjà eu affaire à cela, savez-vous combien de temps cela risque de prendre ? Car ça fait plus d'un mois et ça continue d'augmenter.
2/ Il n'y a pas tout simplement un moyen de lui demander d'arrêter de buter là-dessus ? J'ai cherché, mais rien trouvé...

Si besoin l'URL de mon site est celle de mon profil.

Merci par avance pour vos réponses :)

Gabriel.
Haut
11 Réponses
Messages: 8552

Enregistré le: 14 Mai 2003

Message le Lun Nov 10, 2014 13:12

2011N2 a écrit:Évidemment, je ne peux pas effectuer 128 000 redirections pour 2 raisons simples : cela me prendrait un temps de fou, et puis cela alourdirait considérablement le fichier .htaccess, qui l'est déjà pas mal avec 1000 redirections.

Si les ID des topics n'ont pas changés, tu peux faire ça en PHP.
Haut
Messages: 16

Enregistré le: 22 Oct 2013

Message le Lun Nov 10, 2014 13:20

Salut,

Merci pour ta réponse.

Je n'ai pas réussi à le faire, de plus le forum était auparavant à l'adresse http://www.forum-entraide-informatique.com/ et désormais c'est http://www.forum-entraide-informatique.com/support/
Simplement car je suis en train de construire un blog sur l'URL de base pour une meilleure organisation, et ça posait des problèmes qu'il ne soit pas à la racine.

Gabriel.
Haut
Messages: 8552

Enregistré le: 14 Mai 2003

Message le Lun Nov 10, 2014 13:36

Le changement de répertoire du forum ne l'empêche pas du tout.
Haut
Messages: 16

Enregistré le: 22 Oct 2013

Message le Lun Nov 10, 2014 13:55

Re,

On a tenté énormément de choses en php avec les URLs pour que cela ne donne pas de 404 même si ce sont les mêmes ID, mais malheureusement à chaque fois ça buggait.

Mais à vrai dire, ce n'est pas un gros problème qu'elles soient différentes, car s'il reste de sites externes renvoient vers des 404, je le vois dans les stats et rajoute une redirection dans le .htaccess.

Le seul truc est que je ne sais pas comment Google pourrait oublier les anciennes URLs... Surement avec le temps mais c'est étrange que ça progresse de jour en jour surtout.

Gabriel.
Haut
Messages: 12286

Enregistré le: 23 Nov 2005

Message le Lun Nov 10, 2014 14:20

Si tu es parti d'un scrap / export de ta base de donnée initiale et si tu as les mêmes ID, ca n'a pas été possible de procéder avec une table de correspondance ? ce qui évite toute gestion via la .htaccess et se fait somme tout assez rapidement ?
Haut
Messages: 16

Enregistré le: 22 Oct 2013

Message le Lun Nov 10, 2014 14:28

Re,

Non justement, ça a été extrêmement complexe : sur mon hébergeur initial, ForumActif je n'avais AUCUN accès à la BDD, à rien du tout en fait.

On a été obligé de faire passer un script qui passait sur tous les sujets et membres pour les récupérer. Une BDD faite maison quoi... Pour ça que les URL c'était pas possible.

Gabriel.
Haut
Messages: 12286

Enregistré le: 23 Nov 2005

Message le Lun Nov 10, 2014 14:30

2011N2 a écrit:On a été obligé de faire passer un script qui passait sur tous les sujets et membres pour les récupérer


Bein je comprends pas du coup pourquoi, étant donné qu'il avait crawler, ne pas avoir récupéré l'url également.

Mais même sans cela, dans un topic PHPBB, voire dans un sous-forum, les id sont présents dans les div qui encadrent le contenu. Rien qu'avec l'id, en connaissant la nomenclature des url du CMS, c'est jouable de mettre au point un script qui détecte l'ancien schéma, isole l'id et redirige sur la nouvelle page équivalente.
Haut
Messages: 623

Enregistré le: 21 Juil 2014

Message le Lun Nov 10, 2014 14:32

2011N2 a écrit:Le seul truc est que je ne sais pas comment Google pourrait oublier les anciennes URLs... Surement avec le temps mais c'est étrange que ça progresse de jour en jour surtout.


des messages sans mise à jour depuis des années, google ne va pas les vérifier tous les jours, c'est donc normal que cela progresse au fur et à mesure qu'il vérifie ces urls.
Haut
Messages: 16

Enregistré le: 22 Oct 2013

Message le Lun Nov 10, 2014 14:37

Re,

Bein je comprends pas du coup pourquoi, étant donné qu'il avait crawler, ne pas avoir récupéré l'url également.

Mais même sans cela, dans un topic PHPBB, voire dans un sous-forum, les id sont présents dans les div qui encadrent le contenu. Rien qu'avec l'id, en connaissant la nomenclature des url du CMS, c'est jouable de mettre au point un script qui détecte l'ancien schéma, isole l'id et redirige sur la nouvelle page équivalente.


Probable qu'il existe une solution, mais tout ce qu'on a essayé de "classique" n'a pas fonctionné, le reste demandait un énorme boulot, et avec déjà toutes les galères qu'on a eu pour cette migration, pas trop eu le courage.

des messages sans mise à jour depuis des années, google ne va pas les vérifier tous les jours, c'est donc normal que cela progresse au fur et à mesure qu'il vérifie ces urls.


Oui à mon avis ce n'est qu'une question de temps, c'était surtout pour savoir si c'était possible de signaler à Google que les URL introuvables répertoriées n'existent plus, pour gagner du temps.

Gabriel.
Haut
Messages: 12286

Enregistré le: 23 Nov 2005

Message le Lun Nov 10, 2014 14:38

Et même sans attendre cela, tu peux en gérer rapidement un bon nombre, en te basant sur les statistiques de visite des pages.
Haut
Messages: 16

Enregistré le: 22 Oct 2013

Message le Lun Nov 10, 2014 14:42

Re,

Oui c'est ce que je fais, je suis attentif aux 404, notamment à cause des liens présents sur d'autres sites, ou même en interne.

Gabriel.
Haut