Rewriting et risque évident de duplication de contenu

Consultez la formation URL Rewriting et sites dynamiques de WebRankInfo / Ranking Metrics


bertimus
WRInaute accro
WRInaute accro
 
Messages: 2227
Inscription: Mer Aoû 24, 2005 11:51

Rewriting et risque évident de duplication de contenu

Message le Ven Fév 23, 2007 2:16

Bonjour,

Ma première question n'est pas technique mais plus une question de pertinence (ou d'inutilité) de mon rewriting.

Sur mon forum punbb, j'ai rewrité toutes les pages de forums par défaut (viewforum.php?id=XXX) sous la forme forum-XXX.html et celles des sujets (viewforum.php?id=XXX) en sujet-XXX.html

Ma question : point de vue référencement et/ou vitesse d'indexation, est-ce réellement bénéfique ce que j'ai fait où me suis-je embêté pour rien ? [Je penche plus pour la solution 2 là :roll:]

Second point, plus grave potentiellement et relatif au risque de duplication de contenu... Ok c'est parti, disons que c'est bien beau, mon forum est rewrité depuis sa création, pas de problème de duplication à ce jour, mais je me dis que si une personne mal intentionnée (et oui ça existe) souhaite m'embêter, il suffit qu'elle fasse des liens vers les pages sources de mon forum (viewforum.php?id=XXX ou viewtopic.php?id=XXX) pour que google puisse les référencer et qu'ainsi la duplication de contenu naisse.
[Dans l'absolu, WRI pourrait avoir exactement ce même problème puisque -webrankinfo.com/forums/viewtopic_68556.htm équivaut à -webrankinfo.com/forums/topic_page_68556_0.htm ou encore à -webrankinfo.com/forums/viewtopic.php?t=68556 - même souci potentiel pour le forum de yagoort qui comme moi tourne sous punbb...]

Bref, je suppose qu'il existe une "rustine" pour empêcher l'indexation des pages sources (non rewritées).

Si tel est le cas, pouvez-vous me la communiquer ? Là, je ne vois vraiment pas.

D'avance GRAND MERCI à vous pour votre future aide.

Bertrand
[En mode parano]

St0uK
Nouveau WRInaute
 
Messages: 5
Inscription: Mer Jan 10, 2007 17:01

Message le Ven Fév 23, 2007 9:51

Trois lignes dans le robots.txt ne suffiraient-elles pas dans ton cas ?

Code: Tout sélectionner
User-agent: *
Disallow: /abonnes/viewforum.php
Disallow: /abonnes/viewtopic.php


RomsIW
WRInaute accro
WRInaute accro
 
Messages: 1062
Inscription: Mar Mai 25, 2004 18:35

Message le Ven Fév 23, 2007 9:55

ça change pas grand chose dans ton cas mais c'est plus joli.

Tout l'intérêt de l'URL ReWriting pour des forums est de mettre l'intitulé du post dans l'URL si possible..


bertimus
WRInaute accro
WRInaute accro
 
Messages: 2227
Inscription: Mer Aoû 24, 2005 11:51

Message le Ven Fév 23, 2007 14:27

St0uK a écrit:Trois lignes dans le robots.txt ne suffiraient-elles pas dans ton cas ?

Code: Tout sélectionner
User-agent: *
Disallow: /abonnes/viewforum.php
Disallow: /abonnes/viewtopic.php


C'est tout, c'est aussi simple et efficace ? [Car je l'ai déjà fait ça]

Pour moi le robots.txt n'était efficace que pour un crawl direct du site, pas forcément pour les liens externes... mais si c'est ça, OK hein :wink:

Merci à vous,

Bertrand

salva
WRInaute accro
WRInaute accro
 
Messages: 2542
Inscription: Dim Avr 16, 2006 19:31

Re: Rewriting et risque évident de duplication de contenu

Message le Ven Fév 23, 2007 14:44

bertimus a écrit:Bonjour,

Ma première question n'est pas technique mais plus une question de pertinence (ou d'inutilité) de mon rewriting.

Sur mon forum punbb, j'ai rewrité toutes les pages de forums par défaut (viewforum.php?id=XXX) sous la forme forum-XXX.html et celles des sujets (viewforum.php?id=XXX) en sujet-XXX.html

Ma question : point de vue référencement et/ou vitesse d'indexation, est-ce réellement bénéfique ce que j'ai fait où me suis-je embêté pour rien ? [Je penche plus pour la solution 2 là :roll:]

Second point, plus grave potentiellement et relatif au risque de duplication de contenu... Ok c'est parti, disons que c'est bien beau, mon forum est rewrité depuis sa création, pas de problème de duplication à ce jour, mais je me dis que si une personne mal intentionnée (et oui ça existe) souhaite m'embêter, il suffit qu'elle fasse des liens vers les pages sources de mon forum (viewforum.php?id=XXX ou viewtopic.php?id=XXX) pour que google puisse les référencer et qu'ainsi la duplication de contenu naisse.
[Dans l'absolu, WRI pourrait avoir exactement ce même problème puisque -webrankinfo.com/forums/viewtopic_68556.htm équivaut à -webrankinfo.com/forums/topic_page_68556_0.htm ou encore à -webrankinfo.com/forums/viewtopic.php?t=68556 - même souci potentiel pour le forum de yagoort qui comme moi tourne sous punbb...]

Bref, je suppose qu'il existe une "rustine" pour empêcher l'indexation des pages sources (non rewritées).

Si tel est le cas, pouvez-vous me la communiquer ? Là, je ne vois vraiment pas.

D'avance GRAND MERCI à vous pour votre future aide.

Bertrand
[En mode parano]

A partir du moment ou une url source est rewritée, elle n'existe plus sous sa forme initiale aux yeux des bots et des visiteurs.
Donc pas de risque de duplicate.

Si d'aventure un concurrent malintentionné pouvait récupérer une url source, ton htaccess se chargerait de la diriger sur l'url avec la syntaxe rewritée.


bertimus
WRInaute accro
WRInaute accro
 
Messages: 2227
Inscription: Mer Aoû 24, 2005 11:51

Re: Rewriting et risque évident de duplication de contenu

Message le Ven Fév 23, 2007 14:54

Si d'aventure un concurrent malintentionné pouvait récupérer une url source, ton htaccess se chargerait de la diriger sur l'url avec la syntaxe rewritée.


Ben non justement, c'est bien ça mon problème...

Si je reprend l'exemple qui est plus haut :
-webrankinfo.com/forums/viewtopic.php?t=68556 est tout autant accessible que -webrankinfo.com/forums/viewtopic_68556.htm

ou encore -http://forum.yagoort.org/forum/viewforum.php?id=46 est tout autant accessible que -forum.yagoort.org/forum/forum-referencement-46.html et rien ne force ainsi l'utilisation de la syntaxe rewritée ?

[Ou alors ai-je manqué une nouvelle chose ? Ce qui est également envisageable :wink:]

salva
WRInaute accro
WRInaute accro
 
Messages: 2542
Inscription: Dim Avr 16, 2006 19:31

Message le Ven Fév 23, 2007 14:59

Si tu rediriges toutes les urls source en 301 sur les url rewritées.


bertimus
WRInaute accro
WRInaute accro
 
Messages: 2227
Inscription: Mer Aoû 24, 2005 11:51

Message le Ven Fév 23, 2007 15:30

OK on y vient, c'est justement là que je coince. Ca me génère une belle erreur 500 là...

Bon ça se fait via le .htaccess mais comment j'inclue les paramètres dans un redirection permanente ?

J'ai en fait l'impression de créer une boucle sans fin puisque viewforum.php?id=13 doit mener vers forum-13.html qui lui-même mène vers viewforum.php?id=13 qui lui même...

Merci pour ton ultime aide :wink:

[HS]Sais-tu que ma mère a grandi à Forbach et que mes grands parents y tenaient l'école maternelle ? :P[/HS]

salva
WRInaute accro
WRInaute accro
 
Messages: 2542
Inscription: Dim Avr 16, 2006 19:31

Message le Ven Fév 23, 2007 19:52

bertimus a écrit:OK on y vient, c'est justement là que je coince. Ca me génère une belle erreur 500 là...

Bon ça se fait via le .htaccess mais comment j'inclue les paramètres dans un redirection permanente ?

J'ai en fait l'impression de créer une boucle sans fin puisque viewforum.php?id=13 doit mener vers forum-13.html qui lui-même mène vers viewforum.php?id=13 qui lui même...

Merci pour ton ultime aide :wink:

[HS]Sais-tu que ma mère a grandi à Forbach et que mes grands parents y tenaient l'école maternelle ? :P[/HS]

As-tu essayé ta règle avec ce flag: [R=301,L]

[HS]Tu es le petit fils à Louis?[/HS]


bertimus
WRInaute accro
WRInaute accro
 
Messages: 2227
Inscription: Mer Aoû 24, 2005 11:51

Message le Ven Fév 23, 2007 20:41

Arf non je n'y arrive pas, note que tu as à faire à un non-spécialiste du .htaccess :wink:

J'ai testé ça mais ça ne change rien :
Code: Tout sélectionner
RewriteRule ^viewforum.php?id=([0-9]+)$ http://www.example.com/forum/forum-$1.html [R=301,L]


bref, je me tracasse peut-être pour rien (?), mon robots.txt inclue
Code: Tout sélectionner
Disallow: /forum/viewtopic.php
Disallow: /forum/viewforum.php
Ca devrait suffire non ?

----------
Pour le HS, hum non, je ne connais pas ce cher Louis, attention hein, je te parle d'un temps que les moins de 50 ans ne peuvent pas connaîtreuhh, Forbach en ce temps là, tilalilalala :)

Mon grand-père, né en 1900, s'appelait Alphonse et était le directeur de l'école de plein air au Schlossberg jusqu'en 1960.
Ma grand-mère quant à elle était directrice de l'école maternelle du quartier Bellevue.
Hum voilà tu sais tout, le nom de famille concerné est Karst ;)


stoff
WRInaute impliqué
WRInaute impliqué
 
Messages: 370
Inscription: Dim Aoû 22, 2004 20:03

Message le Ven Fév 23, 2007 21:18

Quels sont justement les retours sur wri?

il me semble pourtant que le forum n'est pas si mal referencé que cela? (idem yagoort).

salva
WRInaute accro
WRInaute accro
 
Messages: 2542
Inscription: Dim Avr 16, 2006 19:31

Message le Ven Fév 23, 2007 22:24

bertimus a écrit:Arf non je n'y arrive pas, note que tu as à faire à un non-spécialiste du .htaccess :wink:

J'ai testé ça mais ça ne change rien :
Code: Tout sélectionner
RewriteRule ^viewforum.php?id=([0-9]+)$ http://www.example.com/forum/forum-$1.html [R=301,L]


bref, je me tracasse peut-être pour rien (?), mon robots.txt inclue
Code: Tout sélectionner
Disallow: /forum/viewtopic.php
Disallow: /forum/viewforum.php
Ca devrait suffire non ?

----------
Pour le HS, hum non, je ne connais pas ce cher Louis, attention hein, je te parle d'un temps que les moins de 50 ans ne peuvent pas connaîtreuhh, Forbach en ce temps là, tilalilalala :)

Mon grand-père, né en 1900, s'appelait Alphonse et était le directeur de l'école de plein air au Schlossberg jusqu'en 1960.
Ma grand-mère quant à elle était directrice de l'école maternelle du quartier Bellevue.
Hum voilà tu sais tout, le nom de famille concerné est Karst ;)

Peux tu poster la règle en fonctionnement décrite dans ton premier post.

Monsieur Louis Houpert devait être (paix à son âme) son successeur.
Il sévissait déjà dans les années 65.


bertimus
WRInaute accro
WRInaute accro
 
Messages: 2227
Inscription: Mer Aoû 24, 2005 11:51

Message le Ven Fév 23, 2007 22:32

Bien sûr, les voici :

Code: Tout sélectionner
RewriteRule ^forum-([0-9]+)-page([0-9]+)\.html$ viewforum.php?id=$1&p=$2 [QSA,L]
RewriteRule ^forum-([0-9]+)\.html$ viewforum.php?id=$1 [QSA,L]

RewriteRule ^sujet-([0-9]+)-page([0-9]+)\.html$ viewtopic.php?id=$1&p=$2 [QSA,L]
RewriteRule ^sujet-([0-9]+)\.html$ viewtopic.php?id=$1 [QSA,L]

salva
WRInaute accro
WRInaute accro
 
Messages: 2542
Inscription: Dim Avr 16, 2006 19:31

Message le Sam Fév 24, 2007 5:53

bertimus a écrit:Bien sûr, les voici :

Code: Tout sélectionner
RewriteRule ^forum-([0-9]+)-page([0-9]+)\.html$ viewforum.php?id=$1&p=$2 [QSA,L]
RewriteRule ^forum-([0-9]+)\.html$ viewforum.php?id=$1 [QSA,L]

RewriteRule ^sujet-([0-9]+)-page([0-9]+)\.html$ viewtopic.php?id=$1&p=$2 [QSA,L]
RewriteRule ^sujet-([0-9]+)\.html$ viewtopic.php?id=$1 [QSA,L]

En remplaçant ceci [QSA,L] par [QSA,R=301,L] ça donne quoi?


bertimus
WRInaute accro
WRInaute accro
 
Messages: 2227
Inscription: Mer Aoû 24, 2005 11:51

Message le Sam Fév 24, 2007 10:29

Ca génère des erreurs 404.

Les liens forums-XX.html ramènent dorénavant vers -www.example.com/home/example/www/forum/viewforum.php?id=XX

Les liens sujet-XX.html ramènent vers -www.example.com/home/example/www/forum/viewtopic.php?id=XX

Rewriting et risque évident de duplication de contenu

Formation recommandée sur ce thème :

Formation URL Rewriting et sites dynamiques : apprenez comment mettre en place la réécriture d'URL, comment optimiser vos URL et profiter de vos pages dynamiques pour booster votre référencement. Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :

Consultez la description détaillée des produits ou services de Google suivants : Google Ventures

  • Calcul du taux de liens profonds
    Cet outil vous permet de calculer le taux de liens profonds vers un site web. Un lien profond est un lien qui ne pointe pas vers la page d'accueil mais au contraire vers une page interne du site. Les sites dont l'essentiel du référencement vient de leurs inscriptions dans des annuaires ont un taux de liens profonds faible ; à l'inverse, les sites de référence ont souvent un taux de liens profonds plus important, signe que leur contenu a suscité de nombreux liens spontanés.


Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités