phpBB et duplicate content
Règles du forum
Attention ce forum est destiné avant tout à ceux qui découvrent le référencement. Les membres qui auront l'amabilité de répondre à leurs questions sont priés de rester courtois, polis, indulgents, patients et pédagogues... Merci d'avance !
Par ailleurs, inutile d'utiliser ce forum uniquement pour obtenir des liens vers vos sites, les liens sont désactivés pour le référencement (nofollow).
Attention ce forum est destiné avant tout à ceux qui découvrent le référencement. Les membres qui auront l'amabilité de répondre à leurs questions sont priés de rester courtois, polis, indulgents, patients et pédagogues... Merci d'avance !
Par ailleurs, inutile d'utiliser ce forum uniquement pour obtenir des liens vers vos sites, les liens sont désactivés pour le référencement (nofollow).
19 messages
• Page 1 sur 2 • 1, 2
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
-

Aquarius - WRInaute occasionnel

- Messages: 447
- Inscription: 8 Nov 2004
phpBB et duplicate content
J'aurai bien posé cette question sur le forum de phpBB-fr mais il est indisponible pour le moment, et je pense que beaucoup de gens sont assez qualifiés pour me répondre ici.
Sur un forum phpBB rewrité l'adresse de base d'un topic et de la forme :
-http://www.site.com/forum/ftopic170.php
Quand le nombre de messages dans le topic est important d'autres pages sont créées et en haut sous le titre du topic on peut naviguer avec "suivante" "précédente" et des numéros. Mais lorsqu'on est sur la deuxième page et que l'on veux revenir sur la première l'adresse donné par "précédente" ou "1" est de la forme :
-http://www.site.com/forum/ftopic170-0-asc-0.php
Les deux adresses renvoie à la même page, et je pense qu'il y a un risque de duplicate content.
Questions :
1/ Y a-t-il vraiment un gros risque ?
2/ Que dois-je mettre dans mon fichier robots.txt pour que les robots ne prennent pas en compte la deuxième adresse ? (En sachant qu'il faut qu'ils prennent tout de même en compte les adresses du type -http://www.site.com/forum/ftopic170-0-asc-15.php)
Merci.
Sur un forum phpBB rewrité l'adresse de base d'un topic et de la forme :
-http://www.site.com/forum/ftopic170.php
Quand le nombre de messages dans le topic est important d'autres pages sont créées et en haut sous le titre du topic on peut naviguer avec "suivante" "précédente" et des numéros. Mais lorsqu'on est sur la deuxième page et que l'on veux revenir sur la première l'adresse donné par "précédente" ou "1" est de la forme :
-http://www.site.com/forum/ftopic170-0-asc-0.php
Les deux adresses renvoie à la même page, et je pense qu'il y a un risque de duplicate content.
Questions :
1/ Y a-t-il vraiment un gros risque ?
2/ Que dois-je mettre dans mon fichier robots.txt pour que les robots ne prennent pas en compte la deuxième adresse ? (En sachant qu'il faut qu'ils prennent tout de même en compte les adresses du type -http://www.site.com/forum/ftopic170-0-asc-15.php)
Merci.
- Daktari
- WRInaute impliqué

- Messages: 623
- Inscription: 10 Mai 2004
J'ai trouvé ce mod sur phpBB-fr et je l'ai placé sur mon forum et ça marche
- Code: Tout sélectionner
##############################################################
## Supprimer _asc_ dans les pages des topics
##############################################################
#
#-----[ OUVRIR ]------------------------------------------
#
viewtopic.php
#
#-----[ TROUVER ]------------------------------------------
#
$pagination = ( $highlight != '' ) ? generate_pagination("viewtopic.$phpEx?" . POST_TOPIC_URL . "=$topic_id&postdays=$post_days&postorder=$post_order&highlight=$highlight", $total_replies, $board_config['posts_per_page'], $start) : generate_pagination("viewtopic.$phpEx?" . POST_TOPIC_URL . "=$topic_id&postdays=$post_days&postorder=$post_order", $total_replies, $board_config['posts_per_page'], $start);
#
#-----[ REMPLACER PAR ]------------------------------------------
#
$pagination = ( $highlight != '' ) ? generate_pagination("viewtopic.$phpEx?" . POST_TOPIC_URL . "=$topic_id", $total_replies, $board_config['posts_per_page'], $start) : generate_pagination("viewtopic.$phpEx?" . POST_TOPIC_URL . "=$topic_id", $total_replies, $board_config['posts_per_page'], $start);
#
#-----[ SAUVEGARDER ET FERMER ]------------------------------------------
#
-

Aquarius - WRInaute occasionnel

- Messages: 447
- Inscription: 8 Nov 2004
Merci pour le mod, il marche pour ce qu'il doit faire, mais il ne résoud pas vraiment mon problème.
Maintenant l'adresse de "précédente" ou "1" est de la forme :
-http://www.site.com/forum/ftopic68-0.php
alors que l'adresse du titre du sujet est de la forme :
-http://www.usj86.com/forum/ftopic68.php
pour la même page... donc risque de duplicate encore une fois.
Mais merci quand même car je préfère les adresses sans les asc
.
Maintenant l'adresse de "précédente" ou "1" est de la forme :
-http://www.site.com/forum/ftopic68-0.php
alors que l'adresse du titre du sujet est de la forme :
-http://www.usj86.com/forum/ftopic68.php
pour la même page... donc risque de duplicate encore une fois.
Mais merci quand même car je préfère les adresses sans les asc
-

Ohax - WRInaute accro

- Messages: 6406
- Inscription: 5 Juil 2004
ton forum est bourré de duplicate en effet
pense à virer les sutra
exemple :
-http://www.usj86.com/forum/sutra202.php
-http://www.usj86.com/forum/sutra218.php
-http://www.usj86.com/forum/sutra220.php
-http://www.usj86.com/forum/setopic_100-.html
va falloir completer ton robots.txt et virer ton ce duplicate
pense à virer les sutra
exemple :
-http://www.usj86.com/forum/sutra202.php
-http://www.usj86.com/forum/sutra218.php
-http://www.usj86.com/forum/sutra220.php
-http://www.usj86.com/forum/setopic_100-.html
va falloir completer ton robots.txt et virer ton ce duplicate
-

Aquarius - WRInaute occasionnel

- Messages: 447
- Inscription: 8 Nov 2004
Voici le code de mon robots.txt
Donc si tu regardes bien Ohax, les sutra sont bloqués et en faisant un site: je n'ai pas de sutra, et t'as réponse ne résout pas mon problème d'adresse de cette forme -http://www.site.com/forum/ftopic68-0.php
- Code: Tout sélectionner
User-agent: *
Disallow: /index.php3?
Disallow: /forum/posting
Disallow: /forum/profile
Disallow: /forum/privmsg
Disallow: /forum/viewonline
Disallow: /forum/groupcp
Disallow: /forum/memberlist
Disallow: /forum/search
Disallow: /forum/login
Disallow: /forum/faq
Disallow: /forum/post-
Disallow: /forum/updates-topic
Disallow: /forum/stop-updates-topic
Disallow: /forum/ptopic
Disallow: /forum/ntopic
Disallow: /forum/sutra
Disallow: /forum/mforum
Disallow: /forum/index.php?
Disallow: /forum/viewtopic.php?
Disallow: /forum/viewforum.php?
Donc si tu regardes bien Ohax, les sutra sont bloqués et en faisant un site: je n'ai pas de sutra, et t'as réponse ne résout pas mon problème d'adresse de cette forme -http://www.site.com/forum/ftopic68-0.php
-

Patrice A. - WRInaute passionné

- Messages: 2415
- Inscription: 11 Fév 2005
Simple, rewrite les liens "viewtopic.php?t=XXX" vers les topic en ftopicXXX-0.php au lieu de ftopicXXX.php. Ca se trouve dans ton includes/page_header.php 
-

Aquarius - WRInaute occasionnel

- Messages: 447
- Inscription: 8 Nov 2004
Merci DJ, mais j'aurai bien aimé garder les adresses du genre ftopicXXXX.php et non ftopicXXXX-0.php, parce que j'ai déjà quelques pages d'indexées avec le premier type d'adresse.
Donc est-ce qu'il n'y aurait pas moyen de faire ce que tu me conseilles mais en faisant l'inverse c'est-à-dire de ftopicXXXX-0.php à ftopicXXXX.php ?
Donc est-ce qu'il n'y aurait pas moyen de faire ce que tu me conseilles mais en faisant l'inverse c'est-à-dire de ftopicXXXX-0.php à ftopicXXXX.php ?
-

Aquarius - WRInaute occasionnel

- Messages: 447
- Inscription: 8 Nov 2004
Après avoir réfléchi un 1/4 de seconde, j'avais pensé que plutot de rewrité les adresses, le mieux serait d'interdir les robots d'indexer les pages ftopicXXXX-0.php
Mais voilà, quelle ligne inscrire dans le fichier robots.txt pour interdir les robots d'indexer ces pages ?
En même temps, après, pour le bot de google adsense va y avoir un problème...
j'y un peu perdu là !!!
Mais voilà, quelle ligne inscrire dans le fichier robots.txt pour interdir les robots d'indexer ces pages ?
En même temps, après, pour le bot de google adsense va y avoir un problème...
-

Aquarius - WRInaute occasionnel

- Messages: 447
- Inscription: 8 Nov 2004
Je veux bien te croire Ohax, mais je ne suis pas un boss ni en rewriting ni en robots.txt, alors je crois que je vais avoir besoin d'un peu plus de précision si ça ne te dérange pas.
Je pense que pour le robots.txt ça doit être
Mais pour le rewriting, là je suis pas trop calé.
Je pense que pour le robots.txt ça doit être
- Code: Tout sélectionner
Disallow: /forum/ftopic0
Mais pour le rewriting, là je suis pas trop calé.
-

Patrice A. - WRInaute passionné

- Messages: 2415
- Inscription: 11 Fév 2005
Ohax, tu sais comment faire pour autoriser le bot Adsense tout en interdisant l'indexation de la page par googlebot dans robots.txt ?
19 messages
• Page 1 sur 2 • 1, 2
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- [duplicate content] optimisation de phpbb
- forum phpbb : problème url rewriting et duplicate content
- Le Duplicate-Content en question : un cas de duplicate content important non-pénalisé
- Sale duplicate content (pas content du tous !!!!!) !!!
- Duplicate content ou pas duplicate
- phpBB et double content
- [help] duplicate content
- Duplicate content possible ?
- duplicate content again
- pb duplicate content
- Optimiser le référencement d'un forum phpBB : réécriture d'URL
- La traduction d'un contenu peut-elle générer une pénalité de duplicate content ?
- Les sites Bounce Pad, pénalisés par le filtre anti-duplicate content de Google ?
- Passage à l'heure d'hiver sur un forum phpBB 3
- Google Webmaster Tools alerte en cas de pb de duplicate content
- Analyse de similarité textuelle
Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages). Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation... Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 2 invités
