Google ne respecte pas les robots.txt ?
9 messages
• Page 1 sur 1
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
- bielle64
- WRInaute occasionnel

- Messages: 253
- Inscription: 19 Jan 2003
Google ne respecte pas les robots.txt ?
Je viens de me rendre combte que Google a indexé un grand nombre de pages de mon site avec des liens php du type :
www.ossau.net/ossau/viewtopic.php?p=975
alors que j'ai bien mis dans mon robots.txt : Disallow: /ossau/viewtopic.php
Google ne respecte pas les robots.txt ??
www.ossau.net/ossau/viewtopic.php?p=975
alors que j'ai bien mis dans mon robots.txt : Disallow: /ossau/viewtopic.php
Google ne respecte pas les robots.txt ??
-

WebRankInfo - Administrateur du site

- Messages: 19415
- Inscription: 19 Avr 2002
je ne savais pas que les lignes vides pouvaient poser problème ! c'est dans le standard du robots.txt ?
- Mirgolth
- WRInaute impliqué

- Messages: 622
- Inscription: 14 Oct 2002
WebRankInfo a écrit:je ne savais pas que les lignes vides pouvaient poser problème ! c'est dans le standard du robots.txt ?
Oui, les lignes vides servent à séparer les enregistrements ( records) composés de lignes User-agents et Disallow. Voilà les lignes correspondantes dans A Standard for Robot Exclusion vers lequel Google pointe :
The file consists of one or more records separated by one or more blank lines (terminated by CR,CR/NL, or NL). Each record contains lines of the form "<field>:<optionalspace><value><optionalspace>". The field name is case insensitive.
The record starts with one or more User-agent lines, followed by one or more Disallow lines, as detailed below. Unrecognised headers are ignored.
Donc après une ligne vide on doit avoir une ligne User-agent.
Mirgolth
- bielle64
- WRInaute occasionnel

- Messages: 253
- Inscription: 19 Jan 2003
Je ne sais pas encore si Google respecte mon nouveau robots.txt mais je viens de me rendre d'un truc assez étrange : mon robots.txt fait partie des pages indexées par Google.
http://www.google.fr/search?q=cache:OIk ... r&ie=UTF-8
C'est normal docteur ?
http://www.google.fr/search?q=cache:OIk ... r&ie=UTF-8
C'est normal docteur ?
9 messages
• Page 1 sur 1
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Google ne respecte pas mon robots.txt!!!!
- Google Image ne respecte pas mon robots.txt
- Google respecte les copyrights!
- google ne respecte pas noindex et les consignes du robot.txt
- clustering non réspecté
- QUE FAIT UN REFERENCEUR QUI SE RESPECTE?
- votre site ne respecte pas la charte
- Yahoo respecte-t-il vraiment rel=nofollow ?
- Microsoft ne respecte pas son contrat !
- Pourquoi mon site ne respecte pas la charte ?
- Sortie de GoogleStats v2.01 - 02-03-2003
- Les crawlers de Yahoo! - 18-03-2004
- Les robots MSNbot de Live Search - 30-11-2006
- Googlebot, le robot d'indexation de Google - 21-02-2003
- Déclarer son fichier sitemap dans le fichier robots.txt - 16-04-2007
- Petit changement pour Slurp (le robot de Yahoo) - 29-03-2007
- La balise meta NOYDIR de Yahoo - 05-03-2007
- Robots.txt : Yahoo supporte les options avancées - 04-11-2006
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 1 invité


