robots.txt et le parcours de Google & autre Bots
3 messages
• Page 1 sur 1
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
- Okin
- Nouveau WRInaute

- Messages: 14
- Inscription: 15 Mai 2005
robots.txt et le parcours de Google & autre Bots
Bonsoir,
Je tiens à signalé d'abord que j'ai fait quelque recherche sans reel réponse à ce que je cherche, j'espere que vous pourrez m'eclairé
Le robots.txt a la racine du site, doit bien interdir l'acces à des fichier, repertoire, que les bots ne referenceront pas, et j'ai une question:
J'utilise l'url rewriting, et j'ai ces 3 fichier php a la racine du site :
dl.php
dl2.php
dl3.php
j'utilise l'url rewriting sur toute les page pour qu'une forme de ce type dossier-truc-1.html appel l'un des fichier php cité plus haut. Seuelemtn, ces 3 fichier php incremente un compteur, et j'aimerais qu'en aucun cas, google, et les autre bot, se parcours ces fichiers en suivant les liens html que je fais grace a l'url rewriting. Ma véritable question est :
Avec les liens html généré grace a l'url rewriting, est ce que les bots sache qu'au final il s'agit des fichier php qui seront appeler ?
Je voudrais enfait evité que n'importe quel bot aille sur ces 3 fichier pour faussé mes stats, et je voulais savoir si d'apres vous, avec un simple robots.txt, cela suffisait, et comment en etre sur ?
Suis je claire ?
Merci beaucoup
Je tiens à signalé d'abord que j'ai fait quelque recherche sans reel réponse à ce que je cherche, j'espere que vous pourrez m'eclairé
Le robots.txt a la racine du site, doit bien interdir l'acces à des fichier, repertoire, que les bots ne referenceront pas, et j'ai une question:
J'utilise l'url rewriting, et j'ai ces 3 fichier php a la racine du site :
dl.php
dl2.php
dl3.php
j'utilise l'url rewriting sur toute les page pour qu'une forme de ce type dossier-truc-1.html appel l'un des fichier php cité plus haut. Seuelemtn, ces 3 fichier php incremente un compteur, et j'aimerais qu'en aucun cas, google, et les autre bot, se parcours ces fichiers en suivant les liens html que je fais grace a l'url rewriting. Ma véritable question est :
Avec les liens html généré grace a l'url rewriting, est ce que les bots sache qu'au final il s'agit des fichier php qui seront appeler ?
Je voudrais enfait evité que n'importe quel bot aille sur ces 3 fichier pour faussé mes stats, et je voulais savoir si d'apres vous, avec un simple robots.txt, cela suffisait, et comment en etre sur ?
Suis je claire ?
Merci beaucoup
-

cybervince - WRInaute impliqué

- Messages: 880
- Inscription: 1 Aoû 2004
Re: robots.txt et le parcours de Google & autre Bots
Okin a écrit:Avec les liens html généré grace a l'url rewriting, est ce que les bots sache qu'au final il s'agit des fichier php qui seront appeler ?
Non, ni les robots, ni les visiteurs peuvent connaitre la vraie url de la page.
Si tu ne veux pas que les robots faussent les stats (car quand ils appellent la page rewritée ca incrémente aussi ton compteur), tu n'a qu'à mettre un système de cloaking qui n'incrémente pas ton compteur si le visiteur est un robot (en te basant sur les ip et/ou le user-agent)
- Okin
- Nouveau WRInaute

- Messages: 14
- Inscription: 15 Mai 2005
Je te remercie cybervince, cela confirme ce que je penssais que l'on m'avais mal dit :p
J'ai trouvé votre script de "robot" hier en php : robotstats v1.
Je vais reprendre les ips, et pour ces 3 page faire une comparaison
)
Edit: Avez vous un site avec la liste de toute les ip à jour ?
(a par votre script), mais qui date de 2003, il y'a sans doute des "nouveau moteur" ?
Merci
J'ai trouvé votre script de "robot" hier en php : robotstats v1.
Je vais reprendre les ips, et pour ces 3 page faire une comparaison
Edit: Avez vous un site avec la liste de toute les ip à jour ?
(a par votre script), mais qui date de 2003, il y'a sans doute des "nouveau moteur" ?
Merci
3 messages
• Page 1 sur 1
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- parcours des robots sur le site
- parcours du site par les robots des moteurs. demande d'avis.
- Bloquer les SCAN BOTS, SPAM BOTS, aspirateurs, etc sur le serveur (iptables, etc...)
- Test : parcours de google dans un site
- Google teste le suivi du parcours d'achat sur internet
- Le parcours de la flamme Olympique 2008 dans Google Earth
- Bots Google
- IPs des bots Google
- faire revenir les bots google ?
- Différences entre les bots google
- Parcours du Tour de France 2009 dans Google Earth : itinéraire, carte 3D, villes étapes - 29-06-2009
- Sortie de GoogleStats v2.01 - 02-03-2003
- Les crawlers de Yahoo! - 18-03-2004
- Les robots MSNbot de Live Search - 30-11-2006
- Déclarer son fichier sitemap dans le fichier robots.txt - 16-04-2007
- Petit changement pour Slurp (le robot de Yahoo) - 29-03-2007
- Tour de France 2010 : parcours dans Google Earth/Maps : itinéraire, carte 3D, villes étapes - 06-07-2010
- La balise meta NOYDIR de Yahoo - 05-03-2007
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités
