Indexation des sections de pages et duplicate content

Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics

firebird75
WRInaute discret
WRInaute discret
 
Messages: 69
Inscription: Sam Déc 10, 2005 11:33

Indexation des sections de pages et duplicate content

Message le Lun Aoû 18, 2008 15:25

Dans certaines pages, on utilise parfois des sections qui sont référencées dans le code par un <a href=#toto> par exemple. Ensuite, on peut joindre ces pages directement par http://www.exemple.com/titi/#toto

Le problème est que http://www.exemple.com/titi/ contient http://www.exemple.com/titi/#toto (Le contenu de http://www.exemple.com/titi/#toto étant une partie de http://www.exemple.com/titi/).

Comment puis je faire pour éviter le duplicate content? J'ai l'impression que google ne se soucie pas trop des pages avec les # et les identifie bien comme des sections mais msn semble les indexer séparément.

Est ce qu'il y a un moyen de bloquer l'indexation des sections par le robots.txt?


nickargall
WRInaute accro
WRInaute accro
 
Messages: 5295
Inscription: Lun Juin 13, 2005 14:13

Message le Lun Aoû 18, 2008 15:47

As tu un exemple du cas que tu indiques pour MSN ? CAD une indexation multiple d'une même page selon les #ancres ?
Google en effet est assez intelligent pour ne pas tenir compte des "#ancre" dans une page ou un lien.

firebird75
WRInaute discret
WRInaute discret
 
Messages: 69
Inscription: Sam Déc 10, 2005 11:33

Message le Lun Aoû 18, 2008 16:56

En fait, msn m'a référencé une page "ancrée", c'est à dire que l'url de la page indexée est celle avec l'ancre sans référencer la page principale (sans l'ancre), c'est vraiment très curieux.

Enfin bon, d'un autre côté, il me référence aussi des pages en noindex donc, je suis plus à ça prêt, l'important, c'est que google fasse les choses intelligemment...

Merci pour ta réponse en tout cas


UsagiYojimbo
WRInaute accro
WRInaute accro
 
Messages: 5069
Inscription: Mer Nov 23, 2005 10:38

Message le Lun Aoû 18, 2008 18:17

Les ancres sont gérées au niveau du navigateur, non du serveur. Donc pour Google, http://www.example.com/toto.php et http://www.example.com/toto.php#titi c'est exactement la même chose (j'ai eu l'occasion de le tester à une époque).


Formation recommandée sur ce thème :

Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :

  • Analyse de similarité textuelle
    Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages). Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation... Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués.
  • Déterminer l'âge d'un site
    Cet outil vous permet de connaître une estimation de l'ancienneté d'un site : il fournit la date à laquelle Google l'a indexé la première fois (et la même chose pour archive.org).
  • Liste de sous-domaines
    Cet outil vous permet de trouver la liste des sous-domaines (indexés) d'un site.


Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités