Consultez la formation SEO spéciale Wordpress
par WebRankInfo / Ranking Metrics

Messages: 583

Enregistré le: 9 Fév 2004

Message le Lun Sep 19, 2011 12:47

Salut,

Depuis un certain temps GG me référence des url bizarres qui font doublons avec les bonnes url.

Mes bonne url sont sous la forme :

Code: Tout sélectionner
http://www.mon-site.com/repertoire/ma-page.html


GG référence d'autres url qui font doublon, du style :

Code: Tout sélectionner
http://www.mon-site.com/repertoire/ma-page.html?liste=bidule
http://www.mon-site.com/repertoire/ma-page.html?pseudo=pseudo
etc...


Quel code faudrait-il écrire dans mon htaccess pour rediriger vers la bonne page toutes les url qui comporte un ? après le html sans tout ce qui derrière le ? ?
Haut
10 Réponses
Messages: 93

Enregistré le: 13 Juil 2004

Message le Lun Sep 19, 2011 16:23

Bonjour,

Normalement avec l'URL rewriting :

Code: Tout sélectionner
RewriteEngine on
RewriteRule ^mapage.html?(.*) mapage.html [R=301]


Je n'ai pas testé mais ça ne devrait pas être loin de la vérité.
Haut
Messages: 2172

Enregistré le: 30 Oct 2008

Message le Lun Sep 19, 2011 18:13

@jvgamers : c'est pas possible car tout ce qui se trouve après le ? ne peut pas être "matché". Pour cela il faut une RewriteCond :
Code: Tout sélectionner
RewriteEngine on
RewriteCond %{QUERY_STRING} ^.+$
RewriteRule ^repertoire/mapage\.html$ /repertoire/mapage.html? [L,R=301]

Je suis parti du principe que ces lignes se trouvent dans le .htaccess qui est à la racine.
Haut
Messages: 93

Enregistré le: 13 Juil 2004

Message le Mar Sep 20, 2011 7:29

Bien vu... Pfiou, j'étais fatigué hier. Merci d'avoir corriger mes boulettes.
Haut
Messages: 13571

Enregistré le: 5 Déc 2004

Message le Mar Sep 20, 2011 7:48

poupilou a écrit:GG référence d'autres url qui font doublon, du style...

Elles viennent d'où ces url ? car a la base écrire du code pour patcher un problème c'est bien mais corriger le problème c'est mieux.
Haut
Messages: 583

Enregistré le: 9 Fév 2004

Message le Mar Sep 20, 2011 16:09

Merci pour vos réponses et merci pour le bout de code forty qui marche parfaitement :D

En fait zeb à vue juste mais d'où proviennent ces url bizarres, GG m'en sort à la pelle du style :

Code: Tout sélectionner
http://www.mon-site.com/repertoire/ma-page.html?liste=bidule
http://www.mon-site.com/repertoire/ma-page.html?pseudo=pseudo
http://www.mon-site.com/repertoire/​fun​cti​on.​inc​lud​e
http://www.mon-site.com/repertoire/fun​cti​on.​mys​ql-​res​ult
http://www.mon-site.com/repertoire/ma-page.htmlkhfhsd
etc...


J'ai fait une recherche sous GG pour voir quelles pages de mon site pouvaient contenir ces url bizarres mais il ne les trouve pas, avez-vous une piste pour que je puisse trouver les pages de mon site qui pourraient contenir des url bizarres ?
Haut
Messages: 12355

Enregistré le: 23 Nov 2005

Message le Mar Sep 20, 2011 16:14

Crawler ton site avec Xenu Link Sleuth, qui te permettra déjà de vérifier si ça vient d'un souci de conception interne (+vérifier les url soumisses via le sitemap ou les flux RSS).
Haut
Messages: 2172

Enregistré le: 30 Oct 2008

Message le Mar Sep 20, 2011 16:16

fun​cti​on.​inc​lud​e et fun​cti​on.​mys​ql-​res​ult proviennent de messages d'erreurs de PHP. Pour les éviter il faut regarder du côté des fonctions set_error_handler() et error_reporting().
Pour les autres je ne sais pas. Regarde du côté de GWT, ca indique parfois un lien foireux sur un site externe.
Haut
Messages: 583

Enregistré le: 9 Fév 2004

Message le Mar Sep 20, 2011 16:39

J'ai crawlé mon site avec Xenu Link Sleuth et il n'y a aucune url bizarre contenant des html?liste= ou http://www.mon-site.com/repertoire/​fun​cti​on.​inc​lud​e je pige plus rien :oops: pour que GG référence une url c'est qu'il l'a trouvé sur le site, on est bien d'accord ?

Avez-vous d'autres pistes ?

Une url du style http://www.mon-site.com/repertoire/​fun​cti​on.​inc​lud​e qui fait une erreur 404 est-elle considéré par GG comme une page doublon de http://www.mon-site.com/repertoire/​ ?
Haut
Messages: 2172

Enregistré le: 30 Oct 2008

Message le Mar Sep 20, 2011 17:18

quand la fonction include rencontre un problème ça génère une erreur et affiche (si tu n'as pas désactivé son affichage) un truc du style :
Code: Tout sélectionner
<b>Warning</b>:  include(fichier_avec_un_probleme.php) [<a href='function.include'>function.include</a>]: failed to open stream: No such file or directory in  ...

tu te retrouves donc avec un lien vers un fichier "function.include" dans le répertoire courant. Ce genre d'erreur arrive de temps en temps et tu ne peux pas y faire grand chose à mon avis. Ca peut venir d'un problème disque temporaire, d'un include en même temps qu'une modif du fichier, ...

Pour les autres erreurs les liens erronés peuvent être externes.
Haut
Messages: 13571

Enregistré le: 5 Déc 2004

Message le Mar Sep 20, 2011 18:07

pour les pages d'erreur php perso je les gère dans le htaccess avec un truc comme ça :

RewriteRule ^(.*)/function(.*)$ http://www.example.com/erreur/404.php [R=301,L]

ma page 404 est en noindex, donc tous les liens pourri de ce genre (problème serveur, script planté etc ...) conduisent définitivement les bot vers une page pas indexée qui répond qu'elle n'existe plu.

edit : pour le hta, je n'ai aucun script qui contiens le mot "function" donc ça passe.
Haut

Formation recommandée sur ce thème :

Formation SEO spéciale Wordpress : apprenez à optimiser le référencement naturel d'un site fait avec Wordpress... Formation Ranking Metrics animée par un expert SEO / Wordpress.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.