Liens internes et externes, les écrire en url ré-ecrite ou pas ?

Nouveau WRInaute
Bonjour,

Sans doute une question déjà couverte mais je n'ai pas trouvé:

Lorsque les pages d'un site sont réécrites dans le htaccess:
Ex: http://mondomaine/product.php?id_product=1 réécrit en http://mondomaine/1-nomduproduit

Et que id_product est configure dans les paramètres d'URL (Google pour Webmaster) de sorte à ce qu'aucune URL l'utilisant ne soit indexée (j'espère que c'est bien ce qu'il faut faire).

Je me pose alors la question de savoir si mes liens internes utilisant l'url non ré-ecrite http://mondomaine/product.php?id_product=1 sont bien comptabilisés par Google et autres robots. Même question métaphysique pour les sites externes pointant vers ma page avec cette URL.

Ou faut il écrire toutes les URLs des liens sous la forme http://mondomaine/1-nomduproduit pour qu'ils soient comptabilisés par Google ?

Je n'y avais pas vraiment prêté attention pour mon premier site, mais mon second (www.sitolog.com) est en ligne depuis une quinzaine de jours. L'indexation des pages à été assez rapide mais le trafic, qui avait rapidement augmenté en trois jours jusqu’à 250 visites jours n'arrête plus de chuter à la même vitesse.
Je cherche un début d'explication. J'ai bien quelques recommandations HTML et pages vu plusieurs fois par Google sous différentes URLs que je suis en train de corriger, mais ça n'explique pas tout.
 
WRInaute accro
A mon sens il est nécessaire de réécrire tes url interne. Ce n'est pas du tout cohérent d'avoir une règle de réécriture mais de ne pas l'utiliser en interne sur ton site. Ca n'a même aucun sens.
 
Nouveau WRInaute
Merci pour ta réponse. Je ne suis pas loin de penser comme toi... mais

... avant de me lancer dans un gros boulot d'édition des liens, je me permet de reposer la question différement, si quelqu'un connait a réponse: Comment Google traite t-il un lien non ré-écrit ? l'ignore t'il parce qu'il ne connait dans son index aucune page avec cet URL ou bien fait il d'abord un tour par le .htaccess, pour regarder si cette URL est réecrite ou redirigée et si c'est le cas, comptabilise t-il le lien, comme un lien vers l'URL réecrite ?

La question mérite d'être posée à mon avis, car il y a une tonne de liens internes, crées par le CMS (en l'occurence Prestashop), du style lien dans les menus, page suivante etc... qui ne sont pas ré-écrits. Et ceux ci je ne peux pas les changer, c'est bien le HtAccess qui s'en charge. Sont ils donc tous ignorés par les robots ?

J'ai suivi il y a 18 mois la formation au référencement d'Olivier, mais je ne me souviens pas que ce point ai été abordé et je ne retrouve rien la dessus dans mes notes.
 
WRInaute accro
Le robot ne sait pas lire le .htaccess (et heureusement). Il ne voit que du HTML. Donc si tu ne les appliques pas toi-même, tes règles de réécriture ne servent pas à grand chose.
 
Nouveau WRInaute
Je ne comprends plus rien alors...

Si le robot ne sait pas lire et utiliser le .htaccess, comment est ce possible qu'il indexe les pages en deux exemplaires, url de base et url ré-ecrite ? il faut bien qu'a un moment, une des deux soit redirigées pour que le code html justement soit retourné.

Sur un autre post de ce même forum, magic33 écrit:
"l'idéal est de faire une redirection de type 301 des anciennes url vers les bonnes url réécrites. En effet s'il existe des Back Links pointant vers les url anciennes versions et qu'elles restent accessibles sans redirections : il y a risque de Duplicate Content car google continuera à les indexer"

Cela ne signifie t-il pas que Google lit le .htAccess est gère les redirection, justement pour comprendre qu'il ne faut pas indexer deux fois a même page ????

Un peu paumé du coup avec le concept de ré-ecriture et de redirection...

Franck
 
WRInaute accro
Le robot ne sait pas lire le htaccess. Il est dirigé par le htaccess, comme n'importe quel utilisateur.

Dans ton htaccess tu n'as pas rajouté la mention pour une redirection permanente (301), donc google comprend que ces liens existent (ils doivent renvoyer un code 200) et il indique les deux
 
Nouveau WRInaute
Je viens de relire cet article et je crois que j'ai pigé (enfin) le principe.

Bon, ben c'est parti, je dois reprendre pas mal de liens internes, surtout dans la partie forum.
J'ai par contre une partie (pied de page) ou les liens internes sont crées par le CMS et ne sont pas réecrits, la je ne sais pas comment je vais faire.

Le dernier point, si j'ai tout bien compris, un lien depuis un site externe, écrit avec l'ancienne url (?Id_product=1) fonctionne bien pour les internautes, mais ne comptera pas comme un lien par Google (url non indexée a cause des nofollow sur ce type de pages dans le robot.txt).
Je pensais à tort que Google ré-écrivait ces URL dans le nouveau format et comptabilisait le lien.

Donc ! : Si les pages d'un site sont bien référencés, dans l'ancien format, grâce à une grande quantités de lien externes , mettre en place une ré-écriture et un nofollow sur les anciennes url peut être désastreux: les liens externes ne compteront plus pour le référencement des pages avec nouvelle URL.
Le seul moyen serait alors de faire des redirections 301 des anciennes URL vers les nouvelles, mais c'est un boulot de titan sur un site dynamique.

Merci pour votre aide
Franck
 
WRInaute accro
Il faut rediriger dans ce cas. En théorie, si les choses sont bien faites, quelqu'un qui taperait cette url, ou cliquerait un lien sur une url de ce type, serait redirigé vers la version réécrite.
 
WRInaute accro
MyPhotoRescue a dit:
Le seul moyen serait alors de faire des redirections 301 des anciennes URL vers les nouvelles, mais c'est un boulot de titan sur un site dynamique.

Absolument pas. Cela peut se gérer dans le header en php :)
 
Discussions similaires
Haut