robots.txt et duplicate content - faut-il lister mon contenu
5 messages • Page 1 sur 1
Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics
robots.txt et duplicate content - faut-il lister mon contenu
Bonjour,
"je" lance un site web et je me pose pas mal de questions.
Pour un certain nombre de raisons, certaines des mes pages sont accessibles via plusieurs urls, par exemple, un article est accessible via :
/markets/market1/articles.aspx?id=33
et
/allservices/articles.aspx?id=33
ai-je intérêt à mettre un disallow sur l'une des deux URLs, sachant que le contenu de la page n'est pas exatement le même ; l'article est le même, mais le titre de la rubrique n'est pas le même (market1 dans le premier cas, services dans le second).
Bon je suppose qu'aux yeux du robot Google c'est la même page, quel est le risque ? Duplicate content ? Cela veut dire que Google va correctement indexer une des deux pages et pas l'autre ? Cela ne me pose pas de problème tant qu'au moins une des deux pages est correctement indexée. Je laisse Google choisir ou je lui colle un robots.txt entre les dents ?
"je" lance un site web et je me pose pas mal de questions.
Pour un certain nombre de raisons, certaines des mes pages sont accessibles via plusieurs urls, par exemple, un article est accessible via :
/markets/market1/articles.aspx?id=33
et
/allservices/articles.aspx?id=33
ai-je intérêt à mettre un disallow sur l'une des deux URLs, sachant que le contenu de la page n'est pas exatement le même ; l'article est le même, mais le titre de la rubrique n'est pas le même (market1 dans le premier cas, services dans le second).
Bon je suppose qu'aux yeux du robot Google c'est la même page, quel est le risque ? Duplicate content ? Cela veut dire que Google va correctement indexer une des deux pages et pas l'autre ? Cela ne me pose pas de problème tant qu'au moins une des deux pages est correctement indexée. Je laisse Google choisir ou je lui colle un robots.txt entre les dents ?
Bonsoir,
En ce moment je teste, non pas un robots.txt, mais des balises meta faisant la même chose.
Le resultat est que toute la partie du site concernée a été désindexquée.
Mais...mais, mais il faut attendre, seulement depuis 15 jours.
Jean.
En ce moment je teste, non pas un robots.txt, mais des balises meta faisant la même chose.
Le resultat est que toute la partie du site concernée a été désindexquée.
Mais...mais, mais il faut attendre, seulement depuis 15 jours.
Jean.
normal.j dahec a écrit:Le resultat est que toute la partie du site concernée a été désindexquée.
Ma question est la suivante :
ai-je intérêt à interdire l'indexation des pages contenant le contenu dupliqué à l'aide du fichier robots.txt (c'est quand même plus propre et plus facile à gérer qu'une metabalise),
ou ai-je intérêt à laisser Googler gérer le problème et à indexer ce que bon lui semble ?
5 messages • Page 1 sur 1
Formation recommandée sur ce thème :
Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Comment éviter les contenus dupliqués (avec/sans le www)
- La balise meta NOYDIR de Yahoo
- Gérer ses paramètres de tracking dans Google Webmaster Tools
- AdWords API Version 3
- Optimiser le référencement d'un blog Dotclear : balises TITLE et META
- Explications sur le Crawl Caching Proxy de Google
- X-Robots-Tag : directive pour bloquer les robots dans l'entête HTTP : explications
- Comment faire ignorer des zones de page pour Yahoo (robots-nocontent)
- Comment lutter contre les mauvaises redirections 302 (temporaires)
- Affichage de la description DMOZ dans MSN Search
- Duplicate content et robots.txt
- Contenu libre / Référencement / Duplicate content /
- Vente de contenu, risque de duplicate content ?
- Eviter le duplicate content (similarité du contenu)
- Echange de contenu : risque de duplicate content ?...
- <Title>, article, contenu: Duplicate content? (site X)
- Un point sur le Duplicate Content (contenu dupliqué)
- Duplicate content pour un site de contenu libre ?
- robots.txt pour éviter le duplicate content sur ma page d'accueil
- Duplicate content avec les pages de mon site 301 ou robots ?
- lister un contenu de repertoire de facon aleatoire
- Technique pour lister les robots, votre avis ?
Consultez la description détaillée des produits ou services de Google suivants : Google Base
- Similarité et duplicate content
Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages). Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation... Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués. - Les sous-domaines d'un site
Cet outil vous permet de trouver la liste des sous-domaines (indexés) d'un site. - Calculer le ratio de liens profonds
Cet outil vous permet de calculer le taux de liens profonds vers un site web. Un lien profond est un lien qui ne pointe pas vers la page d'accueil mais au contraire vers une page interne du site. Les sites dont l'essentiel du référencement vient de leurs inscriptions dans des annuaires ont un taux de liens profonds faible ; à l'inverse, les sites de référence ont souvent un taux de liens profonds plus important, signe que leur contenu a suscité de nombreux liens spontanés.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités






le forum