Meilleure solution pour éviter le dupplicate content

Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics

Lorange
Nouveau WRInaute
 
Messages: 42
Inscription: Lun Jan 02, 2006 14:46

Meilleure solution pour éviter le dupplicate content

Message le Lun Jan 02, 2006 17:00

Bonjour,

J'ai un site qui regroupe des profils d'utilisateurs. Chaque profil d'utilisateur est constitué de 4 pages:

a) main.php
b) photos.php
c) portrait.php
d) contact.php

Chacune de ces pages peut se voir attribuer deux paramètres:

1) ID de l'utilisateur
2) Langue

J'ai enfin réussi à faire un url rewriting correct!


Les nouvelles URL sont donc:

a) main.php?id=00034&langue=fr >>> NOM_UTILISATEUR-fr.html
b) photos.php?id=00034&langue=fr >>> photos-NOM_UTILISATEUR-fr.html
b) portrait.php?id=00034&langue=fr >>> portrait-NOM_UTILISATEUR-fr.html
b) contact.php?id=00034&langue=fr >>> contact-NOM_UTILISATEUR-fr.html

---

Voilà :)


Ma question:

Qu'est-ce qu'il faut faire maintenant pour éviter le dupplicate content?

Est-ce suffisant de mettre ceci dans mon fichier robot.txt

Code: Tout sélectionner
User-agent:  *
Disallow: /main.php
Disallow: /portrait.php
Disallow: /pictures.php
Disallow: /contact.php



Est-ce que cela signifie que les moteurs ne vont pas referencer

-http://monsite.com/pictures.php?id=00034&langue=fr ?


Merci pour votre aide[/b]


Aquarius
WRInaute impliqué
WRInaute impliqué
 
Messages: 447
Inscription: Lun Nov 08, 2004 19:37

Message le Lun Jan 02, 2006 17:07

Dans le doute j'ajouterai ça aussi

Code: Tout sélectionner
User-agent:  *
Disallow: /main.php
Disallow: /portrait.php
Disallow: /pictures.php
Disallow: /contact.php
Disallow: /main.php?
Disallow: /portrait.php?
Disallow: /pictures.php?
Disallow: /contact.php?

Lorange
Nouveau WRInaute
 
Messages: 42
Inscription: Lun Jan 02, 2006 14:46

Message le Lun Jan 02, 2006 17:33

Ah tu crois?

En fait j'ai regardé le fichier robot.txt de WRI... et apparemment ce n'est pas nécessaire, mais je n'en sais rien à vrai dire.

Mescal
WRInaute discret
WRInaute discret
 
Messages: 82
Inscription: Mer Jan 08, 2003 14:50

Message le Mar Jan 03, 2006 4:53

D'après GG, pour ne pas indexer les pages générées dynamiquement, y'a l'entrée robots.txt suivante :
Disallow: /*?


Formation recommandée sur ce thème :

Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :

  • Détection de pages dupliquées
    Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages). Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation... Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués.


Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités