Fichier robots efficace?
10 messages
• Page 1 sur 1
Consultez la formation URL Rewriting et sites dynamiques de WebRankInfo / Ranking Metrics
-

jeanluc - WRInaute accro

- Messages: 3049
- Inscription: 3 Mai 2004
Re: Fichier robots efficace?
Le fichier robots.txt est utile, mais son rôle est souvent mal compris. robots.txt est uniquement un outil de dialogue avec les propriétaires de robots de bonne volonté.passion a écrit:Bonsoir,
Pensez-vous qu'un fichier robots est suffisamment efficace pour interdire l'indexation d'une url??
robots.txt sert à indiquer aux propriétaires de robots de bonne volonté que leur robot ne doit pas visiter certaines adresses. Il fonctionne bien avec les robots des principaux moteurs de recherche et avec de nombreux autres robots.
robots.txt ne peut pas empêcher un robot destiné à la collecte pirate d'adresses e-mail (par exemple) de lire toutes les pages de ton site. Seul .htaccess pourrait effectivement empêcher un robot "voyou" de lire certaines pages, mais les robots "voyou" changent souvent d'adresse IP et de user-agent, donc, en pratique, cela reste difficile de s'en débarasser.
Jean-Luc
- zed2
- Nouveau WRInaute

- Messages: 12
- Inscription: 19 Aoû 2006
Re: Fichier robots efficace?
jeanluc a écrit:les robots "voyou" changent souvent d'adresse IP et de user-agent, donc, en pratique, cela reste difficile de s'en débarasser.
Pour l'ip ok, pour l'agent, suffit de mettre une * pour séléctionner tout les agents
Voici mon robots.txt qui pour le moment me protége bien :
- Code: Tout sélectionner
User-agent: *
Disallow: /
- zed2
- Nouveau WRInaute

- Messages: 12
- Inscription: 19 Aoû 2006
anguenot.com a écrit:http://www.google.fr/search?q=+site%3Awww.google.fr%2Fpda
Et pourtant: http://www.google.fr/robots.txt
Faut dire aussi qu'ils sont pas tréés fort... Si tu prend un sans ? ca marche trés bien, il ne retourne rien... Si ils testaient leur boulot "les pros" il ferait moin de bétises
Enfin, moi je serai le premier a me planter remarque
-

jeanluc - WRInaute accro

- Messages: 3049
- Inscription: 3 Mai 2004
Je ne vois pas où est le problème. Leur robots.txt interdit de visiter les pages dont l'URL commence par /pda?.anguenot.com a écrit:http://www.google.fr/search?q=+site%3Awww.google.fr%2Fpda
Et pourtant: http://www.google.fr/robots.txt
Si le point d'interrogation, n'est pas présent, la page peut être visitée. Le point d'interrogation est un caractère spécial comme le pourcent et les URL
http://www.google.fr/pda%3F&as_q%3D%3Ca%20href=
et
http://www.google.fr/pda?&as_q%3D%3Ca%20href=
sont bien des URL différentes, même si on pourrait croire que %3F égale ?.
Jean-Luc
10 messages
• Page 1 sur 1
Formation recommandée sur ce thème :
Formation URL Rewriting et sites dynamiques : apprenez comment mettre en place la réécriture d'URL, comment optimiser vos URL et profiter de vos pages dynamiques pour booster votre référencement. Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- probleme avec fichier robots.txt fichier bloquer
- Fichier robots.txt VS balise meta robots
- Erreurs Robots.txt sans fichier Robots.txt
- Fichier robots txt
- Fichier robots.txt
- expressions régulieres et fichier robots
- fichier robots.txt optimal
- Limites du fichier robots.txt
- erreurs Fichier Robots.txt
- Fichier robots.txt manquant
Consultez la description détaillée des produits ou services de Google suivants : Google Feed Fetcher, Google Sitemaps
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités



