Fichier robots efficace?
10 messages • Page 1 sur 1
Consultez la formation URL Rewriting et sites dynamiques de WebRankInfo / Ranking Metrics
Re: Fichier robots efficace?
Le fichier robots.txt est utile, mais son rôle est souvent mal compris. robots.txt est uniquement un outil de dialogue avec les propriétaires de robots de bonne volonté.passion a écrit:Bonsoir,
Pensez-vous qu'un fichier robots est suffisamment efficace pour interdire l'indexation d'une url??
robots.txt sert à indiquer aux propriétaires de robots de bonne volonté que leur robot ne doit pas visiter certaines adresses. Il fonctionne bien avec les robots des principaux moteurs de recherche et avec de nombreux autres robots.
robots.txt ne peut pas empêcher un robot destiné à la collecte pirate d'adresses e-mail (par exemple) de lire toutes les pages de ton site. Seul .htaccess pourrait effectivement empêcher un robot "voyou" de lire certaines pages, mais les robots "voyou" changent souvent d'adresse IP et de user-agent, donc, en pratique, cela reste difficile de s'en débarasser.
Jean-Luc
Re: Fichier robots efficace?
jeanluc a écrit:les robots "voyou" changent souvent d'adresse IP et de user-agent, donc, en pratique, cela reste difficile de s'en débarasser.
Pour l'ip ok, pour l'agent, suffit de mettre une * pour séléctionner tout les agents
Voici mon robots.txt qui pour le moment me protége bien :
- Code: Tout sélectionner
User-agent: *
Disallow: /
anguenot.com a écrit:http://www.google.fr/search?q=+site%3Awww.google.fr%2Fpda
Et pourtant: http://www.google.fr/robots.txt
Faut dire aussi qu'ils sont pas tréés fort... Si tu prend un sans ? ca marche trés bien, il ne retourne rien... Si ils testaient leur boulot "les pros" il ferait moin de bétises
Enfin, moi je serai le premier a me planter remarque
Je ne vois pas où est le problème. Leur robots.txt interdit de visiter les pages dont l'URL commence par /pda?.anguenot.com a écrit:http://www.google.fr/search?q=+site%3Awww.google.fr%2Fpda
Et pourtant: http://www.google.fr/robots.txt
Si le point d'interrogation, n'est pas présent, la page peut être visitée. Le point d'interrogation est un caractère spécial comme le pourcent et les URL
http://www.google.fr/pda%3F&as_q%3D%3Ca%20href=
et
http://www.google.fr/pda?&as_q%3D%3Ca%20href=
sont bien des URL différentes, même si on pourrait croire que %3F égale ?.
Jean-Luc
10 messages • Page 1 sur 1
Formation recommandée sur ce thème :
Formation URL Rewriting et sites dynamiques : apprenez comment mettre en place la réécriture d'URL, comment optimiser vos URL et profiter de vos pages dynamiques pour booster votre référencement. Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Sortie de GoogleStats v2.01
- Déclarer son fichier sitemap dans le fichier robots.txt
- Robots.txt : Yahoo supporte les options avancées
- Comment gérer simplement les sitemaps de plusieurs sites au même endroit
- Petit changement pour Slurp (le robot de Yahoo)
- Exalead rejoint le protocole Sitemaps.org
- Article sur le fichier .htaccess
- Les crawlers de Yahoo!
- Yahoo Audio Search
- Les robots MSNbot de Live Search
- probleme avec fichier robots.txt fichier bloquer
- Erreurs Robots.txt sans fichier Robots.txt
- Fichier robots txt
- Fichier robots.txt
- Indexation du fichier robots.txt
- Utilisation du fichier robots.txt
- Contenu du fichier robots.txt
- protéger le fichier robots.txt
- Creer un fichier robots.txt?
- Où placer le fichier robots.txt ?
- Wikio et son fichier robots.txt
- [RESOLU] difference fichier robots et htaccess ?
- Index google et fichier robots.txt ?
- problème avec le fichier robots.txt
- Troncature pour un fichier robots.txt
Consultez la description détaillée des produits ou services de Google suivants : Google Feed Fetcher, Google Sitemaps
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités





le forum