A propos des fichiers robots.txt ...
4 messages • Page 1 sur 1
Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics
A propos des fichiers robots.txt ...
Bonjour
Est-il vraiment indispensable de déposer un fichier robots.txt du genre:
si l' on veut que le bot indexe toutes les pages d' un site ?
Mon site (dont je tairais l' url) n' en avait point et était bien référencé par voila (par google aussi mais çà n' a pas changé). Je me renseigne au sujet de Pompos et vois qu' ils conseillent vivement de mettre un fichier robots.txt pour permettre une bonne indexation d' un site.
Du coup j' en met un, celui cité plus haut.
Je passe sur voila et constate que le moteur a sacqué toutes mes pages (mais a laissé curieusement l' unique page d' accueil de mon site il y a plusieurs mois alors que celui-ci était en totale construction et qu' il n' y avait rien).
Je vais sur leur FAQ et lis ceci:
à cette adresse: http://www.voila.fr/Informations/Recherche/?Robots
Il y a t' il un lien de cause à effet ?
Je n' ai par ailleur pas constaté d' amélioration dans le référencement de google lié à ce fameux robots.txt, dans quels cas est-ce important de l' inclure ?
Merci d' avance pour vos indications
Est-il vraiment indispensable de déposer un fichier robots.txt du genre:
- Code: Tout sélectionner
# Allow all
User-agent: *
Disallow:
si l' on veut que le bot indexe toutes les pages d' un site ?
Mon site (dont je tairais l' url) n' en avait point et était bien référencé par voila (par google aussi mais çà n' a pas changé). Je me renseigne au sujet de Pompos et vois qu' ils conseillent vivement de mettre un fichier robots.txt pour permettre une bonne indexation d' un site.
Du coup j' en met un, celui cité plus haut.
Je passe sur voila et constate que le moteur a sacqué toutes mes pages (mais a laissé curieusement l' unique page d' accueil de mon site il y a plusieurs mois alors que celui-ci était en totale construction et qu' il n' y avait rien).
Je vais sur leur FAQ et lis ceci:
Le fichier robots.txt interdit aux moteurs de recherche d'indexer vos pages web
Si vous ne voulez pas que les robots visitent votre site, ou bien si vous désirez que votre site soit retiré de la base, il vous suffit de placer un fichier /robots.txt à la racine de votre site.
Le fichier /robots.txt vous permet de spécifier par qui et comment vous autorisez l'indexation de votre page.
à cette adresse: http://www.voila.fr/Informations/Recherche/?Robots
Il y a t' il un lien de cause à effet ?
Je n' ai par ailleur pas constaté d' amélioration dans le référencement de google lié à ce fameux robots.txt, dans quels cas est-ce important de l' inclure ?
Merci d' avance pour vos indications
Bonjour,
Il semble que voila n'aime pas la ligne "Disallow:" quand il n'y a pas de répertoire mentionné.
J'ai changé récemment, en mettant la même chose que toi et cela m'a valu d'être purement et simplement retiré de voila
Le mieux est encore un fichier robots.txt avec 2 lignes:
User-agent: *
Disallow: /prive/
si tu veux interdire l'accès au répertoire /prive
Le seul problème, à mon avis, c'est qu'il donne aux hackers une indication quant à l'emplacement de certaines données perso... d'où cible privilégiée.
Dan
Il semble que voila n'aime pas la ligne "Disallow:" quand il n'y a pas de répertoire mentionné.
J'ai changé récemment, en mettant la même chose que toi et cela m'a valu d'être purement et simplement retiré de voila
Le mieux est encore un fichier robots.txt avec 2 lignes:
User-agent: *
Disallow: /prive/
si tu veux interdire l'accès au répertoire /prive
Le seul problème, à mon avis, c'est qu'il donne aux hackers une indication quant à l'emplacement de certaines données perso... d'où cible privilégiée.
Dan
hetzeld a écrit:Le seul problème, à mon avis, c'est qu'il donne aux hackers une indication quant à l'emplacement de certaines données perso... d'où cible privilégiée.
Argh, un abus de langage.
Hop, j'y vais de mon petit commentaire.
Le terme correct pour désigner les délinquants dont tu parles est 'cracker' .
"Hacker" est un terme qui désigne les codeurs fous qui font ce qu'est internet, les systèmes d'exploitation etc... Un hacker construit, un cracker détruit.
Utiliser un terme à la place de l'autre est néfaste pour la communauté hacker qui à force se trimbale une image de hors la loi alors qu'il ne s'agit que de passionnés.
Plus d'information par la:
http://www.tuxedo.org/~esr/jargon/html/ ... acker.html
Pour en revenir au problème du répertoire privés.
SI il s'agit d'informations vraiment sensibles, ne pas les mettre sur le web du tout
Sinon, interdire aux robots d'y aller, restreindre l'acces par un .htaccess et surtout, ne permettre l'acces que par ssl.
Baser sa sécurité uniquement sur la discretion n'est pas une bonne idée.
Hop.
Bonjour,
Tu as raison, c'est un abus de langage !
C'est d'autant plus c*n que je connais parfaitement la différence entre les deux...
Merci pour ce correctif!
Quand je parle de "données perso", ce n'est bien sûr rien de confidentiel mais des éléments qui ne devraient pas être indexés. J'ai eu le cas avec des "templates" qui, à l'état brut' n'étaient pas vraiment parlants pour l'internaute moyen.
Depuis, j'ai modifié cela.
Tu as tout à fait raison en insistant sur le fait que "cacher n'est pas protéger".
Cordialement,
Dan
Tu as raison, c'est un abus de langage !
C'est d'autant plus c*n que je connais parfaitement la différence entre les deux...
Merci pour ce correctif!
Quand je parle de "données perso", ce n'est bien sûr rien de confidentiel mais des éléments qui ne devraient pas être indexés. J'ai eu le cas avec des "templates" qui, à l'état brut' n'étaient pas vraiment parlants pour l'internaute moyen.
Depuis, j'ai modifié cela.
Tu as tout à fait raison en insistant sur le fait que "cacher n'est pas protéger".
Cordialement,
Dan
4 messages • Page 1 sur 1
Formation recommandée sur ce thème :
Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Yahoo Audio Search
- Sortie de GoogleStats v2.01
- Déclarer son fichier sitemap dans le fichier robots.txt
- Alexa lance un moteur de recherche d'images
- Référencement de vidéos avec les fichiers sitemaps vidéo
- Google crawle les fichiers CSS
- Robots.txt : Yahoo supporte les options avancées
- Contraintes d'emplacement du Sitemap
- Les crawlers de Yahoo!
- Chercher des fichiers KML dans Google Earth
- A propos des scripts d'upload de fichiers
- Fichiers robots.txt
- [Résolu] Fichiers robots.txt
- Fichiers robots.txt et connexion.
- les fichiers robots.txt avantagent Google
- 2 noms de domaines et les fichiers robots.txt ?
- Erreur dans Google Sitemaps à propos de Robots.txt
- Plusieurs fichiers robots.txt sur un même hébergement?
- Exclure les robots des fichiers de log IIS
- Le fichier robots.txt et le flash + fichiers.txt
- robots.txt et balise meta robots, incompatibilité ?
- Interdire certains robots ? Comment ? Quels robots ?
- Robots utiles et robots inutiles
- Erreurs Robots.txt sans fichier Robots.txt
- Robots et la balise..."Robots"CONTENT="index,
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités





le forum