A propos des fichiers robots.txt ...
4 messages
• Page 1 sur 1
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
- bipbip
- WRInaute discret

- Messages: 103
- Inscription: 19 Déc 2002
A propos des fichiers robots.txt ...
Bonjour
Est-il vraiment indispensable de déposer un fichier robots.txt du genre:
si l' on veut que le bot indexe toutes les pages d' un site ?
Mon site (dont je tairais l' url) n' en avait point et était bien référencé par voila (par google aussi mais çà n' a pas changé). Je me renseigne au sujet de Pompos et vois qu' ils conseillent vivement de mettre un fichier robots.txt pour permettre une bonne indexation d' un site.
Du coup j' en met un, celui cité plus haut.
Je passe sur voila et constate que le moteur a sacqué toutes mes pages (mais a laissé curieusement l' unique page d' accueil de mon site il y a plusieurs mois alors que celui-ci était en totale construction et qu' il n' y avait rien).
Je vais sur leur FAQ et lis ceci:
à cette adresse: http://www.voila.fr/Informations/Recherche/?Robots
Il y a t' il un lien de cause à effet ?
Je n' ai par ailleur pas constaté d' amélioration dans le référencement de google lié à ce fameux robots.txt, dans quels cas est-ce important de l' inclure ?
Merci d' avance pour vos indications
Est-il vraiment indispensable de déposer un fichier robots.txt du genre:
- Code: Tout sélectionner
# Allow all
User-agent: *
Disallow:
si l' on veut que le bot indexe toutes les pages d' un site ?
Mon site (dont je tairais l' url) n' en avait point et était bien référencé par voila (par google aussi mais çà n' a pas changé). Je me renseigne au sujet de Pompos et vois qu' ils conseillent vivement de mettre un fichier robots.txt pour permettre une bonne indexation d' un site.
Du coup j' en met un, celui cité plus haut.
Je passe sur voila et constate que le moteur a sacqué toutes mes pages (mais a laissé curieusement l' unique page d' accueil de mon site il y a plusieurs mois alors que celui-ci était en totale construction et qu' il n' y avait rien).
Je vais sur leur FAQ et lis ceci:
Le fichier robots.txt interdit aux moteurs de recherche d'indexer vos pages web
Si vous ne voulez pas que les robots visitent votre site, ou bien si vous désirez que votre site soit retiré de la base, il vous suffit de placer un fichier /robots.txt à la racine de votre site.
Le fichier /robots.txt vous permet de spécifier par qui et comment vous autorisez l'indexation de votre page.
à cette adresse: http://www.voila.fr/Informations/Recherche/?Robots
Il y a t' il un lien de cause à effet ?
Je n' ai par ailleur pas constaté d' amélioration dans le référencement de google lié à ce fameux robots.txt, dans quels cas est-ce important de l' inclure ?
Merci d' avance pour vos indications
-

hetzeld - WRInaute passionné

- Messages: 2209
- Inscription: 2 Déc 2002
Bonjour,
Il semble que voila n'aime pas la ligne "Disallow:" quand il n'y a pas de répertoire mentionné.
J'ai changé récemment, en mettant la même chose que toi et cela m'a valu d'être purement et simplement retiré de voila
Le mieux est encore un fichier robots.txt avec 2 lignes:
User-agent: *
Disallow: /prive/
si tu veux interdire l'accès au répertoire /prive
Le seul problème, à mon avis, c'est qu'il donne aux hackers une indication quant à l'emplacement de certaines données perso... d'où cible privilégiée.
Dan
Il semble que voila n'aime pas la ligne "Disallow:" quand il n'y a pas de répertoire mentionné.
J'ai changé récemment, en mettant la même chose que toi et cela m'a valu d'être purement et simplement retiré de voila
Le mieux est encore un fichier robots.txt avec 2 lignes:
User-agent: *
Disallow: /prive/
si tu veux interdire l'accès au répertoire /prive
Le seul problème, à mon avis, c'est qu'il donne aux hackers une indication quant à l'emplacement de certaines données perso... d'où cible privilégiée.
Dan
-

melmoth - WRInaute discret

- Messages: 73
- Inscription: 11 Déc 2002
hetzeld a écrit:Le seul problème, à mon avis, c'est qu'il donne aux hackers une indication quant à l'emplacement de certaines données perso... d'où cible privilégiée.
Argh, un abus de langage.
Hop, j'y vais de mon petit commentaire.
Le terme correct pour désigner les délinquants dont tu parles est 'cracker' .
"Hacker" est un terme qui désigne les codeurs fous qui font ce qu'est internet, les systèmes d'exploitation etc... Un hacker construit, un cracker détruit.
Utiliser un terme à la place de l'autre est néfaste pour la communauté hacker qui à force se trimbale une image de hors la loi alors qu'il ne s'agit que de passionnés.
Plus d'information par la:
http://www.tuxedo.org/~esr/jargon/html/ ... acker.html
Pour en revenir au problème du répertoire privés.
SI il s'agit d'informations vraiment sensibles, ne pas les mettre sur le web du tout
Sinon, interdire aux robots d'y aller, restreindre l'acces par un .htaccess et surtout, ne permettre l'acces que par ssl.
Baser sa sécurité uniquement sur la discretion n'est pas une bonne idée.
Hop.
-

hetzeld - WRInaute passionné

- Messages: 2209
- Inscription: 2 Déc 2002
Bonjour,
Tu as raison, c'est un abus de langage !
C'est d'autant plus c*n que je connais parfaitement la différence entre les deux...
Merci pour ce correctif!
Quand je parle de "données perso", ce n'est bien sûr rien de confidentiel mais des éléments qui ne devraient pas être indexés. J'ai eu le cas avec des "templates" qui, à l'état brut' n'étaient pas vraiment parlants pour l'internaute moyen.
Depuis, j'ai modifié cela.
Tu as tout à fait raison en insistant sur le fait que "cacher n'est pas protéger".
Cordialement,
Dan
Tu as raison, c'est un abus de langage !
C'est d'autant plus c*n que je connais parfaitement la différence entre les deux...
Merci pour ce correctif!
Quand je parle de "données perso", ce n'est bien sûr rien de confidentiel mais des éléments qui ne devraient pas être indexés. J'ai eu le cas avec des "templates" qui, à l'état brut' n'étaient pas vraiment parlants pour l'internaute moyen.
Depuis, j'ai modifié cela.
Tu as tout à fait raison en insistant sur le fait que "cacher n'est pas protéger".
Cordialement,
Dan
4 messages
• Page 1 sur 1
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Robots.txt et ht access à propos des fichiers d'un repertoire
- 2 fichiers robots.txt -> deux fichiers sitemap. C'est bon?
- A propos des scripts d'upload de fichiers
- Fichiers robots.txt
- [Résolu] Fichiers robots.txt
- Fichiers robots.txt et connexion.
- les fichiers robots.txt avantagent Google
- 2 noms de domaines et les fichiers robots.txt ?
- Erreur dans Google Sitemaps à propos de Robots.txt
- Plusieurs fichiers robots.txt sur un même hébergement?
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités
