Robots txt et interdiction depage rewriitées

Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics

curumo
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 35
Inscription: 21 Jan 2006

Robots txt et interdiction depage rewriitées

Message le Jeu Jan 26, 2006 1:00

Bonsoir, je ne sais pas si je suis dans le bon forum mais j'ai cherché à faire au mieux...

Bon voilà j'utilise un url rewritting pour un forum phpbb... Celui ci utilise dans cet htacess :

Code: Tout sélectionner
RewriteEngine On
RewriteCond %{HTTP_HOST} !^www.aratars.org$
RewriteRule ^(.*)   http://www.aratars.org/$1  [QSA,L,R=301]
RewriteRule ^forums.* index.php
RewriteRule ^mforum([0-9]*).* viewforum.php?f=$1&mark=topics
RewriteRule ^viewforum([0-9]*)-([0-9]*)-([0-9]*).* viewforum.php?f=$1&topicdays=$2&start=$3
RewriteRule ^forum([0-9]*).* viewforum.php?f=$1
RewriteRule ^ptopic([0-9]*).* viewtopic.php?t=$1&view=previous
RewriteRule ^ntopic([0-9]*).* viewtopic.php?t=$1&view=next
RewriteRule ^stopic([0-9]*)-([0-9]*).* viewtopic.php?t=$1&watch=topic&start=$2
RewriteRule ^utopic([0-9]*)-([0-9]*).* viewtopic.php?t=$1&unwatch=topic&start=$2
RewriteRule ^ftopic([0-9]*)-([0-9]*)-([a-zA-Z]*)-([0-9]*).* viewtopic.php?t=$1&postdays=$2&postorder=$3&start=$4
RewriteRule ^ftopic([0-9]*)-([0-9]*).* viewtopic.php?t=$1&start=$2
RewriteRule ^ftopic([0-9]*).* viewtopic.php?t=$1
RewriteRule ^ftopic([0-9]*).html viewtopic.php?t=$1&start=$2&postdays=$3&postorder=$4&highlight=$5
RewriteRule ^setopic_([0-9]*)-([a-zA-Z0-9]*).* viewtopic.php?t=$1&highlight=$2
RewriteRule ^sutra([0-9]*).* viewtopic.php?p=$1
RewriteRule ^newtopic([0-9]*).* viewtopic.php?t=$1&view=newest


Or Google en manque de lien s'est mis en tête de visiter mes pages de profil (interdit) essayer de poster (retiré depuis peu) etc...

Son dernier delire est de cliquer sur les "messages suivants" d'un topic donc ici les liens "ntopic" et "ptopic"

Le seul soucis est que ses fameux liens ne correspondent à rien si ce n'est un même sujet déjà visité... En plus lorsque je cherche à visiter moi le lien (merci robotstats) ca plante. Cela doit être similaire pour ce cher robot :D

Donc j'ai cherché à modifier mon robtos.txt comme suit :

Code: Tout sélectionner
User-agent: *
Disallow:/login.php
Disallow:/modcp.php
Disallow:/posting.php
Disallow:/privmsg.php
Disallow:/search.php
Disallow:/viewonline.php
Disallow:/profile.php
Disallow:/memberlist.php
Disallow:/faq.php
Disallow:/raccourci.php
Disallow:/statistics.php
Disallow:/ntopic([0-9]*).php
Disallow:/ptopic([0-9]*).php


Seulement MSN ne semble pas franchement perturber par les deux derniers élements...

Comment est-il possible d'interdire toutes les pages en ntopicXXXX.php et ptopicXXXXX.php et cela pour toutes valeurs de X ?!!

D'avance merci parce que là ca depasse de très très loin mes compétences !


Maze12
WRInaute impliqué
WRInaute impliqué
 
Messages: 506
Inscription: 7 Juil 2005

Message le Jeu Jan 26, 2006 3:09

je pense que si tu n'as pas de page rewriter que tu veuilles indexer commencant par /ntopic ou /ptopic tu peux faire:

Disallow:/ntopic*
Disallow:/ptopic*

quelqu'un confirme parce que j'en suis pas certain..


jeanluc
WRInaute accro
WRInaute accro
 
Messages: 3062
Inscription: 3 Mai 2004

Message le Jeu Jan 26, 2006 8:07

Bonjour,

On ne doit pas utiliser d'astérisque (*) dans les directives Disallow concernant tous les user agents (celles qui concernent User-agent: *). L'astérisque y est considérée comme un caractère comme les autres.

Si tu veux interdire l'accès à tout ce qui commence par /ntopic, tu écris :
Code: Tout sélectionner
Disallow: /ntopic


Si tu veux interdire l'accès à tout ce qui commence par /ntopic0, /ntopic1, ..., /ntopic9, tu écris :
Code: Tout sélectionner
Disallow: /ntopic0
Disallow: /ntopic1
Disallow: /ntopic2
Disallow: /ntopic3
Disallow: /ntopic4
Disallow: /ntopic5
Disallow: /ntopic6
Disallow: /ntopic7
Disallow: /ntopic8
Disallow: /ntopic9
Non, ce n'est pas élégant ... :wink:

Ce n'est pas compliqué. J'ai mis en ligne un résumé de ce qu'il faut savoir sur robots.txt : http://www.annuaire-info.com/robots/txt.html.

Jean-Luc

curumo
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 35
Inscription: 21 Jan 2006

Message le Jeu Jan 26, 2006 9:46

OK merci j'étais étonné d'une pareille solution parce que un Disallow :/xxx était je pensais pour des repertoires or ici ceux sont des fichiers ;)


Si vous avez aimé cette discussion, partagez-la sur vos réseaux sociaux préférés :

Formation recommandée sur ce thème :

Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités