robots.txt pour éviter le duplicate content sur ma page d'accueil

Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics

tdesvages
Nouveau WRInaute
 
Messages: 20
Inscription: Mer Juin 11, 2008 14:51

robots.txt pour éviter le duplicate content sur ma page d'ac

Message le Mer Déc 03, 2008 10:40

Bonjour,

Je viens de remarquer que ma page d'accueil était accessible avec les 3 url:
www.monsite.fr
www.monsite.fr/index.php
www.monsite.fr/index.php?lang=fr

Bien évidemment, Google c'est empressé de référencer ces 3 url avec un contenu et des META identiques...

J'ai donc mis un fichier robots.txt à la racine de mon site:

Code: Tout sélectionner
User-agent: *
Disallow: /index.php
Disallow: /index.php?lang=fr
Disallow: /index.php?lang=en


2 questions pour les pros:
- ce code est-il bon pour ne garder que la page www.monsite.fr dans les résultats Google
- Dans quelle mesure ce duplicate content m'a t'il porté préjudice jusqu'à maintenant? J'avais l'impression de monter trrrrèèèès lentement en PR pour cette page, est-ce que c'est du en partie à ça?

Merci pour votre aide,

TO


Leonick
WRInaute accro
WRInaute accro
 
Messages: 12358
Inscription: Dim Aoû 08, 2004 20:24

Message le Mer Déc 03, 2008 11:32

normalement /index.php?lang=fr et /index.php?lang=en devraient donner 2 contenus différents, donc devant être indexés, non ?

tdesvages
Nouveau WRInaute
 
Messages: 20
Inscription: Mer Juin 11, 2008 14:51

Message le Mer Déc 03, 2008 12:12

J'ai voulu faire simple, mais effectivement c'est pas logique:

J'utilise un site Joomla multilingue avec réecriture d'url, mais je ne me suis pas posé la question des duplicate content avant.

Le multilingue crée des duplicate content puisque ma page d'accueil (monsite.fr) est chargée soit en langue française soit en anglais en fonction de la langue du navigateur du visiteur qui arrive dans le site.
Les mêmes contenus sont accessibles depuis un sélecteur de langues qui renvoie soit vers monsite.fr/fr pr les navigateurs français soit vers monsite.fr/en pr les navigateurs anglais.

J'aurais pu effectuer une redirection depuis la page d'accueil monsite.fr, mais c'est un peu bête puisque c'est vers elle que pointent tous les liens de mes partenaires...
J'ai donc simplement mis des balises META différentes pour chacune de ces pages pour éviter le duplicate


La réécriture d'url crée aussi des duplicate content pour chacune de ces pages puisque

monsite.fr/index.php?
est réécrit
monsite.fr/

monsite.fr/index.php?lang=en
réécrit
monsite.fr/en

monsite.fr/index.php?lang=fr
réécrit
monsite.fr/fr

et que toutes ces pages étaient accessibles et référencées par Google (c'est pourquoi j'ai créé ce robots.txt)



Bref, c'était pas vraiment optimisé tout ça... Pensez-vous que c'est mieux maintenant?... enfin si vous avez compris le chmilblic...


Leonick
WRInaute accro
WRInaute accro
 
Messages: 12358
Inscription: Dim Aoû 08, 2004 20:24

Message le Mer Déc 03, 2008 12:30

pourquoi avoir besoin du /index.php?lang=fr c'est la page par défaut, non ? donc pour moi il ne devrait y avoir que
www.example.com/ et www.example.com/en

PS : le site à utiliser pour les démos, c'est example.com celui que tu utilises appartient à pagesjaunes et tu leur donnes plein de BL gratuitement :lol:

tdesvages
Nouveau WRInaute
 
Messages: 20
Inscription: Mer Juin 11, 2008 14:51

Message le Mer Déc 03, 2008 16:41

T'as raison, ils ont un PR8 sur le .fr depuis le temps que tout le monde fait la même erreur que moi...

Pour www.example.com/ et www.example.com/en t'as aussi raison, j'ai mis ça dans mon .htaccess:

Code: Tout sélectionner
RedirectPermanent /fr http://www.example.com


Sinon, étant donné que je n'ai pas eu de réponse quand au fichier robots.txt dont je parlais au début de ce topic, j'imagine qu'il doit être bon.

Merci pour l'info

Fini le duplicate, ça va guincher sur Google!

D'ailleurs j'ai encore une petite question:
c'est mieux dans ce cas de faire une redirection de www.example.com/index.php vers www.example.com
OU
de mettre un Disallow: /index.php dans le robots.txt ?


Formation recommandée sur ce thème :

Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :

  • Similarité et duplicate content
    Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages). Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation... Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués.


Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités