Quels sont les risques de duplicate content ?

WRInaute passionné
Un lien est toujours bon à prendre. Tu n'as rien à craindre si beaucoup de ces URLs se ressemblent.
Le duplicate content s'applique sur le contenu du site et non sur les URLs.
Voilà si on a pu te rassurer tant mieux! ;)
 
WRInaute accro
olivier3249 a dit:
Un lien est toujours bon à prendre. Tu n'as rien à craindre si beaucoup de ces URLs se ressemblent.
Le duplicate content s'applique sur le contenu du site et non sur les URLs.
Voilà si on a pu te rassurer tant mieux! ;)

Oui mais justement, Google indexera des contenus identiques sous des URLs différentes si j'ai bien compris... Donc duplicate sans aucun doute.
 
Olivier Duffez (admin)
Membre du personnel
webmasterlamogere a dit:
le nom n'a pas d'importance pour le duplicate c'est le contenu.
Sinon + est identique à %20 : les deux remplacent l'espace
je crois que tu mélanges un peu tout ?
les exemples donnés par magic correspondent bien à des URL différentes, donc le risque de duplicate content est maximal
 
WRInaute passionné
blman a dit:
olivier3249 a dit:
Un lien est toujours bon à prendre. Tu n'as rien à craindre si beaucoup de ces URLs se ressemblent.
Le duplicate content s'applique sur le contenu du site et non sur les URLs.
Voilà si on a pu te rassurer tant mieux! ;)

Oui mais justement, Google indexera des contenus identiques sous des URLs différentes si j'ai bien compris... Donc duplicate sans aucun doute.

Je n'ai pas trop compris? Car tout à l'heure tu ne parlais pas de contenu identique mais d'URL identique.
En gros, si tu as des liens sur des URLs presque identique (juste le ndd qui change) il n'y a pas de problème.
 
WRInaute occasionnel
En gros ce n'est pas bon pour le référencement. Il ne faut pas construire des pages ayant le même contenu, sur des url différentes. Une page = un contenu différent. Dans ton cas le site qui fait un lien du style

www.monurl.com/le+nom+de+ma+page.html
www.monurl.com/le-nom-de-ma-page.html
Etc. Moi je pense automatiquement que tes pages proposent le même contenu dans des pages différentes. Si maintenant ton site propose du contenu normalement, c'est à dire dans la regle, il est possible qu'un éditeur, créateur, webmasters enfin. Ajoutent un lien des différentes url que tu lui propose. C'est possible même qui fait un lien sur différentes pages de son site des url différentes de ton site.

Avec tes url que tu me parle ci-dessus et avec du contenu différent je pense que sa peut être pris pour du duplicate. Je ne vois pas pourquoi utiliser une url presque identique aux autres en sachant que url est susceptible de correspondre a ton contenu.

Enfin moi je vois comme ça.
 
WRInaute passionné
la question est de savoir si ces url ont le même contenu, dans ce cas il y a clairement duplicate content et recevoir ces différents liens est plutôt un cadeau empoisonné (ou en tout cas pas très bénéfique)

solution: en choisir une (je prendrais la 2ème ;) ) , et rediriger toutes les autres dessus via une redirection 301.
 
WRInaute occasionnel
carole heinz a dit:
la question est de savoir si ces url ont le même contenu, dans ce cas il y a clairement duplicate content et recevoir ces différents liens est plutôt un cadeau empoisonné (ou en tout cas pas très bénéfique)

solution: en choisir une (je prendrais la 2ème ;) ) , et rediriger toutes les autres dessus via une redirection 301.

Ta raison. Je fais le même choix si j’avais un choix à faire.
 
WRInaute accro
Re: quels sont les risques ?

magic a dit:
slt :)

si des sites me font des liens sous ces differentes formes :

www.monurl.com/le+nom+de+ma+page.html
www.monurl.com/le-nom-de-ma-page.html
www.monurl.com/le,nom,de,ma,page.html
www.monurl.com/le%20nom%20de%20ma%20page.html

les moteurs vont ils interpreter ces urls comme etant identiques ou bien differentes et donc les prendre comme duplicate content ?

d'avance merci

Magic, ta question demande une petite précision qui a toute son importance puisque personne ne semble avoir compris la même chose :
- ces 4 URLs mènent-elles à la même page (même contenu) ? Dans ce cas, gros risque de duplicate content.
- ces 4 URLs mènent-elles à des pages diférentes (contenu différent) ? Dans ce cas, aucun risque de duplicate content.

Voila, en gros ;) Répond nous à ces questions si tu veux plus d'explication sur le pourquoi du comment ???
 
WRInaute accro
Salut,

si ces 4 URLs mènent à la même page (même contenu)
alors
il te faut user de l'url rewritting plus robots.txt
sinon
rien
:lol:
 
WRInaute discret
bonjour

merci pour vos reponses :)

oui effectivement " le nom de ma page ".html
c tjs la meme sur mes 4 exemples.

reste a savior comment les nabigateur interprete ces separateurs.
 
WRInaute accro
magic a dit:
bonjour

merci pour vos reponses :)

oui effectivement " le nom de ma page ".html
c tjs la meme sur mes 4 exemples.

reste a savior comment les nabigateur interprete ces separateurs.

Tu a plusieurs solutions pour que le format de tes URLs soient conforment à la normalisation que tu t'ais fixer en avant projet. Personnellement, j'aime bien la solution de tester cette conformité en PHP et de faire une redirection vers la bonne URL via les headers.

Mais en tout cas, sache que l'URL est l'identifiant d'une page (ou d'un contenu) et que celle si devrait toujours être unique : il n'y a qu'une et une seule URL qui identifie une page.

Donc il faudrait toujours veiller à ce que ce soit le cas :
- vérifier la conformité dans les headers ou autre solution
- vérifier la conformité de tes liens : qu'ils soient internes ou externes
- choisir des normes (solutions de rewriting ou autres) qui ne laisse aucune ambigitué à ce sujet
- etc...
 
Olivier Duffez (admin)
Membre du personnel
olivier3249 a dit:
En gros, si tu as des liens sur des URLs presque identique (juste le ndd qui change) il n'y a pas de problème.
attention, ce que tu dis me semble faux... comme l'ont bien expliqué les autres intervenants dans la discussion
 
WRInaute discret
pouahh c'est un cas compliqué alors :(

car d'une c'est facile pour la "concurrence" de faire du mal à un site

ensuite la mise en place d'un htaccess ou autre pour faire comprendre aux moteurs que la reelle structure d'un lien est composé de + ou de ,

c'est reloud tout ca :(
 
WRInaute passionné
aïe, j'ai l'impression qu'en effet, c'est un peu la confusion, là.

ce n'est pas "reloud" du tout, c'est très simple.

1 URL = 1 page: OK
3 URL = 3 pages différentes: OK
3 URL = 1 page identique: pas bon
3 URL = 3 pages identiques: pas bon

je ne comprends pas le pb. est-ce que, oui ou non, une page x est accessible via plusieurs URL (x,y,z)?

je vois mal comment c'est possible.

on ne peut pas vous aider si vous ne répondez pas précisément à toutes les questions qui ont été posées ci-dessus.

j'ai l'impression qu'en fait il s'agit d'un serveur qui "corrige" les fautes des URL et renvoie la page qui correspond le mieux à l'url soumise, si c'est le cas pas de pb.

ex sur un de mes blogs chez zeblog:

-http://vosgesfreeride.zeblog.com/330724-photos-couloirs-hohneck-vosges-couloirs-wormspel/
-http://vosgesfreeride.zeblog.com/330724-phts-culirs-hhneck-vsges-culirs-wrmspel/

(je supprime tous les "o" de l'url mais cela renvoie sur la même page, ce n'est pas grave, ce n'est pas du duplicate content: tous mes liens internes et tous les backlinks pointent vers la bonne URL, google choisit la bonne page et ne pénalise en aucun cas le site)

;)
 
WRInaute accro
Y'a rien de relou, c'est juste de la rigueur. Après tu n'es pas obligé d'appliqué les règles.

Plusieurs cas :

- ta page est accessible depuis plusieurs URLs mais tu t'en fou : tant pis, tu sera juste freiné dans Google mais tu t'en fou vu que tu ne te souci pas des moteurs
- ta page est accessible depuis plusieurs URL mais tu a fait attention à ce que tes liens externes et internes suivent la même norme et renvois toujours la même URL : c'est déjà un gros plus pour les moteurs. Mais attention que tes concurrents ne te fassent pas des liens vers ces mêmes pages en utilisant des formats d'URLs différents.
- le top : ta page n'est pas accessible depuis plusieurs URLs : si on essais d'y accéder par une autre URL : soit ça renvoit une 404, soit ça renvoie une redirection (cas de la majorité des rewriting). Tu a pris la peine de protéger tes pages pour qu'elles restent normaliser. Bon là on est sur du gros projet très orienté SEO.

Ex :
-http://www.oazik.com/25336-le-duo-new-bossa.htm
-http://www.oazik.com/25336-le-duo-new-bossa-et-blabmlabla.htm
(pourtant même Id)

A toi de choisir la solution qui te convient le mieux. Rien de relou la dedans ;)

PS : Attention carole heinz à ce que tes concurrents ne te fassent pas des liens pourris ;)
 
WRInaute passionné
blman a dit:
PS : Attention carole heinz à ce que tes concurrents ne te fassent pas des liens pourris ;)

je les attends de pied ferme, tiens. ça serait même un test rigolo. mais yaura un retour de bâton, forcément. :twisted:
 
WRInaute discret
bon ok ^^

alors exemple concret :

http://www.eureklic.com/etude+de+cas-1.html
http://www.eureklic.com/etude-de-cas-1.html
http://www.eureklic.com/etude%20de%20cas-1.html
http://www.eureklic.com/etude,de,cas-1.html renvoie la meme page mais est considéré comme requetes differentes et l'url devient http://www.eureklic.com/etude%2Cde%2Ccas-1.html

dans tous les cas la page affiché est la meme d'où ma question car afin de sortir de la version béta j'aimerais eclaircir ce detail important

est ce plus clair ainsi ?
 
WRInaute passionné
si deux url ont le même contenu c'est du duplicate content que le nom de la page soit proche ou pas.
de plus ça ne me semble pas super bon d'indexer des résultats de recherche justement a cause du duplicate.
 
WRInaute discret
magic a dit:
bon ok ^^

alors exemple concret :

http://www.eureklic.com/etude+de+cas-1.html
http://www.eureklic.com/etude-de-cas-1.html
http://www.eureklic.com/etude%20de%20cas-1.html
http://www.eureklic.com/etude,de,cas-1.html renvoie la meme page mais est considéré comme requetes differentes et l'url devient http://www.eureklic.com/etude%2Cde%2Ccas-1.html

dans tous les cas la page affiché est la meme d'où ma question car afin de sortir de la version béta j'aimerais eclaircir ce detail important

est ce plus clair ainsi ?

Et pourquoi tes pages sont accessibles par différents liens?? c'est ça qui complique
Ceux qui veulent faire un lien vers toi n'auraont qu'à prendre la vrai url de ta page et tu fais des 301 pour les faux liens déjà existant!
 
WRInaute accro
magic a dit:
bon ok ^^

alors exemple concret :

http://www.eureklic.com/etude+de+cas-1.html
http://www.eureklic.com/etude-de-cas-1.html
http://www.eureklic.com/etude%20de%20cas-1.html
http://www.eureklic.com/etude,de,cas-1.html renvoie la meme page mais est considéré comme requetes differentes et l'url devient http://www.eureklic.com/etude%2Cde%2Ccas-1.html

dans tous les cas la page affiché est la meme d'où ma question car afin de sortir de la version béta j'aimerais eclaircir ce detail important

est ce plus clair ainsi ?

Ah oui mais là, ce sont des recherches que tu balance en GET... Tu ne peux donc rien y faire. Normalement, les bots d'indexations n'effectue pas de recherche et les résultats de recherche ne devraient pas être indexer sinon, à mon avis tu risque pire que le duplicate content... Car là, ton histoire s'apparent à quelque chose du genre spamdexing.
 
WRInaute discret
c'est surtout pour me premunir au cas ou quelqu'un souhaite ou fait un lien direct vers une page de resultats et n'utilise pas la syntaxe conforme au site ^^
 
WRInaute accro
magic a dit:
c'est surtout pour me premunir au cas ou quelqu'un souhaite ou fait un lien direct vers une page de resultats et n'utilise pas la syntaxe conforme au site ^^

Alors le plus simple serait peut-être de passer un paramètre supplémentaire lors d'une recherche et si ce paramètre est passé, alors tu dis aux moteurs de ne pas indexer cette page avec une meta="noindex, nofollow" (vérifier la syntaxe, de mémoire, pas sûr que ce soit ça).
 
WRInaute occasionnel
<meta name="robots" content="noindex, nofollow" />

Vu le mouvement actuel de Google (pénalité croissante suite aux diverses duplications de pages/sites), mieux vaut se protéger, que cela soit "relou" ou non.
 
Discussions similaires
Haut