Duplicate content après URL rewriting

Consultez la formation URL Rewriting et sites dynamiques de WebRankInfo / Ranking Metrics


lo2b
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 498
Inscription: 25 Jan 2007

Duplicate content après URL rewriting

Message le Lun Avr 13, 2009 19:01

Bonjour,

J'ai mis en place une URL rewriting qui fonctionne (N.B.: il s'agit d'un MediaWiki chez 1&1)

LocalSettings.php
Code: Tout sélectionner
$wgScriptPath = "";
$wgScript = "$wgScriptPath/index.php5";
$wgRedirectScript = "$wgScriptPath/redirect.php5";
$wgArticlePath = "$wgScriptPath/$1";
$wgScriptExtension = ".php5";


.htaccess
Code: Tout sélectionner
AddType x-mapp-php5 .php
AddHandler x-mapp-php5 .php
RewriteEngine On
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_FILENAME} !-d
RewriteRule ^(.+)$ /index.php?title=$1 [L,QSA]


MAIS les pages demeurent potentiellement accessibles avec et sans l'URL rewriting
http://www.wikipolitique.fr/WikiPolitique
-http://www.wikipolitique.fr/index.php5?title=WikiPolitique

Comment empêcher Google de les indexer sous la forme non réécrite (erreur dans mon URL rewriting ? mettre un code dans robots.txt ?)

Merci !

L.Jee
WRInaute accro
WRInaute accro
 
Messages: 7192
Inscription: 11 Déc 2007

Re: Duplicate content après URL rewriting

Message le Lun Avr 13, 2009 20:20

Soit effectivement tu les interdits dans ton robots.txt, soit tu places une règle de redirection dans ton htaccess ;)


lo2b
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 498
Inscription: 25 Jan 2007

Re: Duplicate content après URL rewriting

Message le Mar Avr 14, 2009 10:38

Merci L.Jee, mais il me semblait l'avoir déjà fait dans mon .htaccess :
RewriteRule ^(.+)$ /index.php?title=$1

Bon sinon, si cela ne fonctionne pas, comment faire dans robots.txt :
Disallow: /index.php5?title=*


lo2b
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 498
Inscription: 25 Jan 2007

Re: Duplicate content après URL rewriting

Message le Mer Avr 15, 2009 9:09

bonjour,

quelq'un peut-il me confirmer que c'est bien la bonne méthode, Google ayant déjà indexé mes pages sous les deux URL :?

Code: Tout sélectionner
User-agent: *
Disallow: /index.php?title=


e-kiwi
Modérateur
Modérateur
 
Messages: 15617
Inscription: 23 Déc 2003

Re: Duplicate content après URL rewriting

Message le Mer Avr 15, 2009 9:34

il y a deux choses :
- la ré-écriture
- la redirection

pour supprimer les anciennes rapidement, ce qu'il te proposait de faire est :
rediriger en 301 les anciennes (les php?...) vers les ré-écrites (blabla.html) , puis le rewriteRule se chargerai d'appeler la bonne page php


lo2b
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 498
Inscription: 25 Jan 2007

Re: Duplicate content après URL rewriting

Message le Mer Avr 15, 2009 9:56

e-kiwi a écrit:il y a deux choses :
- la ré-écriture
- la redirection

pour supprimer les anciennes rapidement, ce qu'il te proposait de faire est :
rediriger en 301 les anciennes (les php?...) vers les ré-écrites (blabla.html) , puis le rewriteRule se chargerai d'appeler la bonne page php


Ah ! merci e-kiwi, je n'avais pas compris ! Je vais immédiatement mettre en place les redirections.
Mais pour le RewriteRule, je ne vois pas ce qui cloche dans mon code (je pense avoir suivi à la lettre les consignes données sur MediaWiki)


lo2b
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 498
Inscription: 25 Jan 2007

Re: Duplicate content après URL rewriting

Message le Mer Avr 15, 2009 10:16

...heu, ça ne fonctionne pas (c'est bien la première fois que je vois une redirection 301 qui ne fonctionne pas)

Code: Tout sélectionner
RedirectPermanent /index.php5?title=WikiPolitique http://www.wikipolitique.fr/WikiPolitique


lo2b
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 498
Inscription: 25 Jan 2007

Re: Duplicate content après URL rewriting

Message le Jeu Avr 16, 2009 14:55

Puisque la redirection 301 ne fonctionne pas, sachant que mes pages sont accessibles avec les deux URL
http://www.wikipolitique.fr/WikiPolitique
et -http://www.wikipolitique.fr/index.php5?title=WikiPolitique

quelqu'un peut-il me confirmer que le code suivant est le bon pour exclure de l'indexation toutes les pages commençant par
-http://www.wikipolitique.fr/index.php5?title=

robots.txt
Code: Tout sélectionner
User-agent: *
Disallow: /index.php?title=


Merci...


Si vous avez aimé cette discussion, partagez-la sur vos réseaux sociaux préférés :

Formation recommandée sur ce thème :

Formation URL Rewriting et sites dynamiques : apprenez comment mettre en place la réécriture d'URL, comment optimiser vos URL et profiter de vos pages dynamiques pour booster votre référencement. Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :

Consultez la description détaillée des produits ou services de Google suivants : Google goo.gl

  • Analyse de similarité textuelle
    Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages). Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation... Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués.
  • Analyse de popularité
    Cet outil vous permet d'analyser en détails la "popularité" de votre site sur Google. En plus du nombre de liens pris en compte par Google, il calcule le pourcentage de liens internes parmi tous les liens, et il affiche les premières URL trouvées.
  • Transformer des simples citations de votre site en liens
    Cet outil vous permet de trouver des pages citant votre site mais ne faisant pas (encore) de lien. Il suffira parfois d'un simple mail pour transformer cette simple citation en lien (backlink).


Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités