phpBB et duplicate content

Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics


Aquarius
WRInaute impliqué
WRInaute impliqué
 
Messages: 447
Inscription: Lun Nov 08, 2004 19:37

phpBB et duplicate content

Message le Mer Juin 08, 2005 11:49

J'aurai bien posé cette question sur le forum de phpBB-fr mais il est indisponible pour le moment, et je pense que beaucoup de gens sont assez qualifiés pour me répondre ici.

Sur un forum phpBB rewrité l'adresse de base d'un topic et de la forme :
-http://www.site.com/forum/ftopic170.php

Quand le nombre de messages dans le topic est important d'autres pages sont créées et en haut sous le titre du topic on peut naviguer avec "suivante" "précédente" et des numéros. Mais lorsqu'on est sur la deuxième page et que l'on veux revenir sur la première l'adresse donné par "précédente" ou "1" est de la forme :
-http://www.site.com/forum/ftopic170-0-asc-0.php

Les deux adresses renvoie à la même page, et je pense qu'il y a un risque de duplicate content.

Questions :
1/ Y a-t-il vraiment un gros risque ?
2/ Que dois-je mettre dans mon fichier robots.txt pour que les robots ne prennent pas en compte la deuxième adresse ? (En sachant qu'il faut qu'ils prennent tout de même en compte les adresses du type -http://www.site.com/forum/ftopic170-0-asc-15.php)

Merci.

Daktari
WRInaute passionné
WRInaute passionné
 
Messages: 623
Inscription: Lun Mai 10, 2004 20:21

Message le Mer Juin 08, 2005 11:59

J'ai trouvé ce mod sur phpBB-fr et je l'ai placé sur mon forum et ça marche :wink:


Code: Tout sélectionner
##############################################################
## Supprimer _asc_ dans les pages des topics
##############################################################
#
#-----[ OUVRIR  ]------------------------------------------
#

viewtopic.php

#
#-----[ TROUVER ]------------------------------------------
#

$pagination = ( $highlight != '' ) ? generate_pagination("viewtopic.$phpEx?" . POST_TOPIC_URL . "=$topic_id&postdays=$post_days&postorder=$post_order&highlight=$highlight", $total_replies, $board_config['posts_per_page'], $start) : generate_pagination("viewtopic.$phpEx?" . POST_TOPIC_URL . "=$topic_id&postdays=$post_days&postorder=$post_order", $total_replies, $board_config['posts_per_page'], $start);

#
#-----[ REMPLACER PAR ]------------------------------------------
#

$pagination = ( $highlight != '' ) ? generate_pagination("viewtopic.$phpEx?" . POST_TOPIC_URL . "=$topic_id", $total_replies, $board_config['posts_per_page'], $start) : generate_pagination("viewtopic.$phpEx?" . POST_TOPIC_URL . "=$topic_id", $total_replies, $board_config['posts_per_page'], $start);

#
#-----[ SAUVEGARDER ET FERMER ]------------------------------------------
#


Aquarius
WRInaute impliqué
WRInaute impliqué
 
Messages: 447
Inscription: Lun Nov 08, 2004 19:37

Message le Mer Juin 08, 2005 12:00

Merci beaucoup je vais tester ça !!!


Aquarius
WRInaute impliqué
WRInaute impliqué
 
Messages: 447
Inscription: Lun Nov 08, 2004 19:37

Message le Mer Juin 08, 2005 12:43

Merci pour le mod, il marche pour ce qu'il doit faire, mais il ne résoud pas vraiment mon problème.

Maintenant l'adresse de "précédente" ou "1" est de la forme :

-http://www.site.com/forum/ftopic68-0.php

alors que l'adresse du titre du sujet est de la forme :

-http://www.usj86.com/forum/ftopic68.php

pour la même page... donc risque de duplicate encore une fois.

Mais merci quand même car je préfère les adresses sans les asc :wink: .

Daktari
WRInaute passionné
WRInaute passionné
 
Messages: 623
Inscription: Lun Mai 10, 2004 20:21

Message le Dim Juin 12, 2005 15:21

Après relecture, je vois à quoi tu fais allusion. C'est vrai que c'est gênant, car ça fait du duplicate content :cry: . Mais je ne vois pas comment résoudre ce problème :oops: .


Ohax
WRInaute accro
WRInaute accro
 
Messages: 6392
Inscription: Lun Juil 05, 2004 13:30

Message le Dim Juin 12, 2005 15:26

ton forum est bourré de duplicate en effet

pense à virer les sutra


exemple :

-http://www.usj86.com/forum/sutra202.php
-http://www.usj86.com/forum/sutra218.php
-http://www.usj86.com/forum/sutra220.php
-http://www.usj86.com/forum/setopic_100-.html


va falloir completer ton robots.txt et virer ton ce duplicate ;-)


Aquarius
WRInaute impliqué
WRInaute impliqué
 
Messages: 447
Inscription: Lun Nov 08, 2004 19:37

Message le Dim Juin 12, 2005 16:50

Voici le code de mon robots.txt

Code: Tout sélectionner
User-agent: *
Disallow: /index.php3?
Disallow: /forum/posting
Disallow: /forum/profile
Disallow: /forum/privmsg
Disallow: /forum/viewonline
Disallow: /forum/groupcp
Disallow: /forum/memberlist
Disallow: /forum/search
Disallow: /forum/login
Disallow: /forum/faq
Disallow: /forum/post-
Disallow: /forum/updates-topic
Disallow: /forum/stop-updates-topic
Disallow: /forum/ptopic
Disallow: /forum/ntopic
Disallow: /forum/sutra
Disallow: /forum/mforum
Disallow: /forum/index.php?
Disallow: /forum/viewtopic.php?
Disallow: /forum/viewforum.php?


Donc si tu regardes bien Ohax, les sutra sont bloqués et en faisant un site: je n'ai pas de sutra, et t'as réponse ne résout pas mon problème d'adresse de cette forme -http://www.site.com/forum/ftopic68-0.php


Patrice A.
Modérateur
Modérateur
 
Messages: 2413
Inscription: Ven Fév 11, 2005 19:36

Message le Dim Juin 12, 2005 17:03

Simple, rewrite les liens "viewtopic.php?t=XXX" vers les topic en ftopicXXX-0.php au lieu de ftopicXXX.php. Ca se trouve dans ton includes/page_header.php ;)


Aquarius
WRInaute impliqué
WRInaute impliqué
 
Messages: 447
Inscription: Lun Nov 08, 2004 19:37

Message le Dim Juin 12, 2005 18:22

Merci DJ, mais j'aurai bien aimé garder les adresses du genre ftopicXXXX.php et non ftopicXXXX-0.php, parce que j'ai déjà quelques pages d'indexées avec le premier type d'adresse.

Donc est-ce qu'il n'y aurait pas moyen de faire ce que tu me conseilles mais en faisant l'inverse c'est-à-dire de ftopicXXXX-0.php à ftopicXXXX.php ?


Aquarius
WRInaute impliqué
WRInaute impliqué
 
Messages: 447
Inscription: Lun Nov 08, 2004 19:37

Message le Dim Juin 12, 2005 18:27

Après avoir réfléchi un 1/4 de seconde, j'avais pensé que plutot de rewrité les adresses, le mieux serait d'interdir les robots d'indexer les pages ftopicXXXX-0.php

Mais voilà, quelle ligne inscrire dans le fichier robots.txt pour interdir les robots d'indexer ces pages ?

En même temps, après, pour le bot de google adsense va y avoir un problème... :cry: j'y un peu perdu là !!!


Ohax
WRInaute accro
WRInaute accro
 
Messages: 6392
Inscription: Lun Juil 05, 2004 13:30

Message le Dim Juin 12, 2005 18:29

faire des urls de forme ftopic0-XXXX.php au lieu de ftopicXXXX-0.php


et c'est ensuite un jeu d'enfant pour le robots.txt ^^


Aquarius
WRInaute impliqué
WRInaute impliqué
 
Messages: 447
Inscription: Lun Nov 08, 2004 19:37

Message le Dim Juin 12, 2005 18:31

Je veux bien te croire Ohax, mais je ne suis pas un boss ni en rewriting ni en robots.txt, alors je crois que je vais avoir besoin d'un peu plus de précision si ça ne te dérange pas.

Je pense que pour le robots.txt ça doit être
Code: Tout sélectionner
Disallow: /forum/ftopic0


Mais pour le rewriting, là je suis pas trop calé.


Patrice A.
Modérateur
Modérateur
 
Messages: 2413
Inscription: Ven Fév 11, 2005 19:36

Message le Dim Juin 12, 2005 20:11

Ohax, tu sais comment faire pour autoriser le bot Adsense tout en interdisant l'indexation de la page par googlebot dans robots.txt ?

Daktari
WRInaute passionné
WRInaute passionné
 
Messages: 623
Inscription: Lun Mai 10, 2004 20:21

Message le Dim Juin 12, 2005 21:22

Dj_Apx a écrit:Ohax, tu sais comment faire pour autoriser le bot Adsense tout en interdisant l'indexation de la page par googlebot dans robots.txt ?


Ajouter

User-agent: Mediapartners-Google*
Disallow:

Daktari
WRInaute passionné
WRInaute passionné
 
Messages: 623
Inscription: Lun Mai 10, 2004 20:21

Message le Sam Juin 18, 2005 21:47

Je remonte le post pour voir si une solution a été trouvée :oops: .

phpBB et duplicate content

Formation recommandée sur ce thème :

Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :

  • Analyse de similarité textuelle
    Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages). Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation... Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués.


Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités