[réglé] robots.txt
22 messages
• Page 1 sur 2 • 1, 2
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
- dcz
- WRInaute impliqué

- Messages: 723
- Inscription: 2 Mar 2005
[réglé] robots.txt
Hello,
J'ai fait une ommission dans mon robots.txt d'un forum phpbb url rewrité, et je l'ai donc mis reéllement en service que très rescemment. Google se met donc à ne plus mettre en cache les pages interdites, seulement, il semble ne pas mettre des pages qui devraient être autorisées.
Par exemple les pages dont l'url finit par forum1,2,3,... php ne sont pas mis en cache alors qu'elle sont précisemment celle que j'aimmerais voir référencé. De plus ggbot semble ne pas référencer du tout les ftopic1,2,3,...php alors que ce serait bien.
http://www.google.fr/search?hl=fr&q=sit ... ogle&meta=
Si vous avez une idée sur la question cela me permettrait d'être de nouveau référencé et ce serait très gentil
++
J'ai fait une ommission dans mon robots.txt d'un forum phpbb url rewrité, et je l'ai donc mis reéllement en service que très rescemment. Google se met donc à ne plus mettre en cache les pages interdites, seulement, il semble ne pas mettre des pages qui devraient être autorisées.
- Code: Tout sélectionner
User-agent: *
Disallow: /forum/posting
Disallow: /forum/profile
Disallow: /forum/privmsg
Disallow: /forum/viewonline
Disallow: /forum/groupcp
Disallow: /forum/memberlist
Disallow: /forum/search
Disallow: /forum/login
Disallow: /forum/faq
Disallow: /forum/post-
Disallow: /forum/updates-topic
Disallow: /forum/stop-updates-topic
Disallow: /forum/ptopic
Disallow: /forum/ntopic
Disallow: /forum/sutra
Disallow: /forum/setopic
Disallow: /forum/mforum
Disallow: /forum/index.php?
Disallow: /forum/viewtopic.php?
Disallow: /forum/viewforum.php?
Par exemple les pages dont l'url finit par forum1,2,3,... php ne sont pas mis en cache alors qu'elle sont précisemment celle que j'aimmerais voir référencé. De plus ggbot semble ne pas référencer du tout les ftopic1,2,3,...php alors que ce serait bien.
http://www.google.fr/search?hl=fr&q=sit ... ogle&meta=
Si vous avez une idée sur la question cela me permettrait d'être de nouveau référencé et ce serait très gentil
++
Dernière édition par dcz le Lun Mai 16, 2005 8:13, édité 2 fois.
- dcz
- WRInaute impliqué

- Messages: 723
- Inscription: 2 Mar 2005
ok
bon c'est fait pour le s, mais ça ne m'aide toujours pas....
LE vrai probleme que j'ai c'est que le bot ne met pas en cache les forum.php alors qu'il devrait.
( du genre
-http://www.marsatak.org/marsforum/forum2.php [edit : devenue http://www.marsatak.org/marsforum/software-vf2.html]
et rien sur les ftopic du genre -http://www.marsatak.org/marsforum/ftopic18.php [edit : devenue http://www.marsatak.org/marsforum/elekt ... -vt18.html]
LE vrai probleme que j'ai c'est que le bot ne met pas en cache les forum.php alors qu'il devrait.
( du genre
-http://www.marsatak.org/marsforum/forum2.php [edit : devenue http://www.marsatak.org/marsforum/software-vf2.html]
et rien sur les ftopic du genre -http://www.marsatak.org/marsforum/ftopic18.php [edit : devenue http://www.marsatak.org/marsforum/elekt ... -vt18.html]
Dernière édition par dcz le Sam Aoû 20, 2005 15:17, édité 1 fois.
-

serval2a - WRInaute accro

- Messages: 3457
- Inscription: 21 Mar 2005
- Code: Tout sélectionner
Disallow: /forum/index.php?
Ce ne serait pas cette ligne qui pose problème.
Sur le principe de l'url rewriting ce n'est pas l'index qui pose problème mais dès que le robot commence à naviguer il créé une requête donc obtient un id puis sur chaque page qu'il visite une adresse style forum/viewtopic.php?f=14&t=240513 qui peut empécher une bonne indexation.
La page index du forum n'ayant aucune variable et aucun sid ne devrait à mon sens par avoir de problème d'indexation.
A mon avis il faut donc sortir cette exclusion du robots.txt, c'est ce que j'ai fait et mon forum est indexé (du moins pour partie).
-

Madrileño - Madrileño

- Messages: 28414
- Inscription: 7 Juil 2004
serval2a a écrit:
- Code: Tout sélectionner
Disallow: /forum/index.php?
Ce ne serait pas cette ligne qui pose problème.
Joli coup d'oeil
mais les pages :
-http://www.marsatak.org/marsforum/forum9.php
-http://www.marsatak.org/marsforum/forum1.php
et compagnie sont indexés (je me suis pas trop casser la tête a chercher)
- dcz
- WRInaute impliqué

- Messages: 723
- Inscription: 2 Mar 2005
a priori non
a priori non, car http://www.marsatak.org/marsforum/index.php est une des deux seules pages mise en cache par google. (cf http://www.google.fr/search?hl=fr&q=sit ... ogle&meta=)
et les autres sont, toujours d'après la même source pas mise en cache.
ni les ftopic d'ailleurs....
pour info, j'ai viré les sid...
et les autres sont, toujours d'après la même source pas mise en cache.
ni les ftopic d'ailleurs....
pour info, j'ai viré les sid...
-

serval2a - WRInaute accro

- Messages: 3457
- Inscription: 21 Mar 2005
Re,
C'est peut-être con mais bon je me lance.
Je constate une différence entre les URL indexées par google et le fichier robots.txt.
marsforum/viewonline.php
Disallow: /forum/viewonline
Tu es allé jusqu'à faire un rewriting du dossier ?
Si la réponse est non remplace forum par marsforum dans le fichier txt.
C'est peut-être con mais bon je me lance.
Je constate une différence entre les URL indexées par google et le fichier robots.txt.
marsforum/viewonline.php
Disallow: /forum/viewonline
Tu es allé jusqu'à faire un rewriting du dossier ?
Si la réponse est non remplace forum par marsforum dans le fichier txt.
- dcz
- WRInaute impliqué

- Messages: 723
- Inscription: 2 Mar 2005
news
Donc,
Sur http://phpbb-fr.com/ , un membre m'a dit qu'il avait le même robots.txt et que google référancait bien toutes ses pages, donc cela doit venir d'autre chose.
Peut être que j'ai un peu "faché" le bot en lui interdisant d'un coup des pages et qu'il se "venge" en ne mettant pas en cache des pages qu'il devrait pourtant indexer normalement, comme -http://www.marsatak.org/marsforum/forum9.php [edit : devenue http://www.marsatak.org/marsforum/marsnews-vf9.html], et en ne suivant pas les lien autorisés comme -http://www.marsatak.org/marsforum/ftopic18.php [edit : devenue http://www.marsatak.org/marsforum/elekt ... -vt18.html].
( http://www.google.fr/search?hl=fr&q=sit ... ogle&meta= )
J'espère que cela va rentrer progressivement dans l'ordre....
On verra bien...
PS : les articles (les ftopic1,2,3,etc.php) ne sont plus accessible via une recherche par mot clefs dans google contrairement à précédemment (elektronika download rc4 me plassait dans les trois premier resultats...), seul les pages mise en cache semblent être rechercheable (clef : vj t34m)....
++
Sur http://phpbb-fr.com/ , un membre m'a dit qu'il avait le même robots.txt et que google référancait bien toutes ses pages, donc cela doit venir d'autre chose.
Peut être que j'ai un peu "faché" le bot en lui interdisant d'un coup des pages et qu'il se "venge" en ne mettant pas en cache des pages qu'il devrait pourtant indexer normalement, comme -http://www.marsatak.org/marsforum/forum9.php [edit : devenue http://www.marsatak.org/marsforum/marsnews-vf9.html], et en ne suivant pas les lien autorisés comme -http://www.marsatak.org/marsforum/ftopic18.php [edit : devenue http://www.marsatak.org/marsforum/elekt ... -vt18.html].
( http://www.google.fr/search?hl=fr&q=sit ... ogle&meta= )
J'espère que cela va rentrer progressivement dans l'ordre....
On verra bien...
PS : les articles (les ftopic1,2,3,etc.php) ne sont plus accessible via une recherche par mot clefs dans google contrairement à précédemment (elektronika download rc4 me plassait dans les trois premier resultats...), seul les pages mise en cache semblent être rechercheable (clef : vj t34m)....
++
Dernière édition par dcz le Sam Aoû 20, 2005 15:19, édité 1 fois.
22 messages
• Page 1 sur 2 • 1, 2
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- [réglé] Url Rewriting et robots.txt
- [regle] Robots.txt est sur ?
- robots.txt pour Googlebot Image [réglé]
- [Réglé] Google, pas plus loin que robots.txt ?
- [reglé]créer son fichier robots.txt
- [Réglé] Empecher les robots de referencer certains fichier
- [regle] peut-on exclure les repertoires // dans robots.txt ?
- [Réglé] Exclure une URL d'une règle de réécriture
- Sortie de GoogleStats v2.01 - 02-03-2003
- Les crawlers de Yahoo! - 18-03-2004
- Les robots MSNbot de Live Search - 30-11-2006
- Déclarer son fichier sitemap dans le fichier robots.txt - 16-04-2007
- Petit changement pour Slurp (le robot de Yahoo) - 29-03-2007
- La balise meta NOYDIR de Yahoo - 05-03-2007
- Robots.txt : Yahoo supporte les options avancées - 04-11-2006
- Comment gérer simplement les sitemaps de plusieurs sites au même endroit - 28-02-2008
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités


