Méga problème : Google et les urls

Nouveau WRInaute
Bonjour à toute la communauté,

Apres avoir effectuer de multiples recherches sur internet et analyser les moindres détails de google webmaster tools je me résous à créer un poste sur ce forum en espérant que vous pourrez me venir en aide.

L'état des lieux :

Nous avons lancé notre site en septembre 2012. Etant encore en version beta (et donc en développement), nous avons du (environ 2 mois après la sortie) changer radicalement notre système d'url rewriting entraînant plus de 2000 erreurs 404 sur Google Webmaster Tools.

Actuellement nous souffrons du référencement quasi inexistant et nous essayons d'améliorer ceci.

Nous nous sommes rendus compte que plus de 2500 pages non sélectionnées contre 1700 indexées.

D'autre part, notre site est disponible en deux langues et nous avons utiliser la balise suivante :

<link rel="alternate" hreflang="fr" href="http://tobefun.net/fr/media/a-professional-gamer-in-action" />


Notre problème :

Sur Google Webmaster Tools, plus de 1500 erreurs d'url (404) détecté. Voici le type d'url que google cherche à indexer :

http://tobefun.net/en/trend/http//tobefun.net/en/trend/tag-voi
http://tobefun.net/en/media/http//tobefun.net/fr/media/obama-sing-at-tree-lighting
http://tobefun.net/fr/frog-like-baby/Account/Cluf


On dirait qu'il essaye de concaténer deux urls. Vraiment étrange. Je ne comprend pas d'ou celà peut venir.

Encore plus étrange si je prend le cas de cette url : http://tobefun.net/en/media/http//tobefun.net/fr/media/obama-sing-at-tree-lighting

Si j'essayer d'"indexer comme google" l'url suivante : http//tobefun.net/fr/media/obama-sing-at-tree-lighting et http://tobefun.net/en/ il n'y a aucun problème !

Petite indication, dans le code de nombreux liens sont en chemin relatif via : <a href="/en/..." /> est-ce que le problème pourra venir de cela ?



Merci d'avance pour votre aide et vos éventuelles réponses.

Cordialement,

PS : Voici l'url du site http://tobefun.net que j'avais déja présente sur ce forum
 
Olivier Duffez (admin)
Membre du personnel
il y a certainement des endroits dans le site où les liens sont mal faits : il faut les trouver et les corriger
et en plus de ça, il faut ajouter des redirections 301 pour faire le nettoyage
 
WRInaute passionné
J'ai eut le même genre de probleme sur une restructuration de mon site il y a un an, avec plusieurs millions d'erreurs 404 (SIC!).

je vois que dans le code html des liens, en page d'accueil, il y a deux types d'url , ex :
<div id="sub-menu-9" class="submenu">
<ul>
<li><a href='/fr/c/cat-sport'>Sport</a></li>
<li><a href='/fr/c/cat-fun'>Fun/Dr&#244;le</a></li>
<li><a href='/fr/c/cat-news'>Actualit&#233;</a></li>
<li><a href='/fr/c/cat-animals'>Animaux</a></li>
<li><a href='/fr/c/cat-mov'>Film/Animation</a></li>
</ul></div>
<div id="sub-menu-8" class="submenu">
<ul>
<li><a href="/fr-FR/user/manage">Gestion des utilisateurs</a> </li>
<li><a href="/fr-FR/package/manage">Gestion des packages</a> </li>
<li><a href="/fr-FR/Suggestion/manage">Gestion des suggestions</a></li>
</ul></div></div>

Dans les liens SUB-MENU-9 , le codage html est comme si c'était sur java script, avec une APOSTROPHE ( <a href=')
et dans le SUB-MENU-8, le codage html est conventionnel, avec des GUILLEMETS ( <a href=")

Google ne sait pas interpréter tous les types de liens, et dans mon cas, l'érreur a été générée par DREAMWEAVER 5 avec l'ajout du type "_new" dans le lien ( <a href="répertoire/page.html" target="_new" > ), que Google a induit en erreur ce type de target sur des millions de pages ... Le remplacement de celui-ci par le classique "_blank" a tout remis en ordre, mais cela a pris au moins 6 mois ...

A première vue, je mettrais l'apostrophe en cause, c'est a vérifier ...
 
Nouveau WRInaute
spout a dit:
tobefun a dit:
Petite indication, dans le code de nombreux liens sont en chemin relatif via : <a href="/en/..." /> est-ce que le problème pourra venir de cela ?
Tu te trompes, c'est un chemin absolu ça.

Complément: http://www.alsacreations.com/astuce/lire/78-quelle-est-la-diffrence-en ... solus.html


Oui autant pour moi chemin absolu...

Sinon j'ai bien vérifié il n'y a pas de liens présent dans le code html, par contre pour les guillemets longo600 tu as raison je vais modifier ça de suite.

Merci pour vos premières réponses, j'espère que ça va permettre de résoudre le problème.
 
Discussions similaires
Haut