Propagation du robots.txt ?
Règles du forum
Attention ce forum est destiné avant tout à ceux qui découvrent le référencement. Les membres qui auront l'amabilité de répondre à leurs questions sont priés de rester courtois, polis, indulgents, patients et pédagogues... Merci d'avance !
Par ailleurs, inutile d'utiliser ce forum uniquement pour obtenir des liens vers vos sites, les liens sont désactivés pour le référencement (nofollow).
Attention ce forum est destiné avant tout à ceux qui découvrent le référencement. Les membres qui auront l'amabilité de répondre à leurs questions sont priés de rester courtois, polis, indulgents, patients et pédagogues... Merci d'avance !
Par ailleurs, inutile d'utiliser ce forum uniquement pour obtenir des liens vers vos sites, les liens sont désactivés pour le référencement (nofollow).
4 messages
• Page 1 sur 1
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
- pr tournesol
- Nouveau WRInaute

- Messages: 3
- Inscription: 12 Juil 2005
Propagation du robots.txt ?
Bonjour à tous,
Je viens de mettre en place su mon site en place un sytème pour détécter les accès des robots au robots.txt. Grâce à ce système, j'enregistre les IPs dans une base, et je pourrai donc les suivre tout au long de leur visite.
Le problème, c'est que d'après ce que j'ai pu lire partout sur les forums, les robots ne passent pas à chaque fois dans robots.txt.
D'ou, m'a question : savez-vous si google ou slurp, etc... peuvent après avoir lu le robots.txt une première fois, revenir lors d'un crawl ultérieur avec une adresse DIFFERENTE de celle utilisée la première fois, et ceci SANS passer par le robots.txt ?
En gros, le robots.txt se propage-t-il dans les fermes de spiders ou est-ce que chacun gère sa propre copie de robots.txt ?
Merci si vous avez des réponses... et bonne vacances à tous !
Je viens de mettre en place su mon site en place un sytème pour détécter les accès des robots au robots.txt. Grâce à ce système, j'enregistre les IPs dans une base, et je pourrai donc les suivre tout au long de leur visite.
Le problème, c'est que d'après ce que j'ai pu lire partout sur les forums, les robots ne passent pas à chaque fois dans robots.txt.
D'ou, m'a question : savez-vous si google ou slurp, etc... peuvent après avoir lu le robots.txt une première fois, revenir lors d'un crawl ultérieur avec une adresse DIFFERENTE de celle utilisée la première fois, et ceci SANS passer par le robots.txt ?
En gros, le robots.txt se propage-t-il dans les fermes de spiders ou est-ce que chacun gère sa propre copie de robots.txt ?
Merci si vous avez des réponses... et bonne vacances à tous !
- dmathieu
- Modérateur

- Messages: 7244
- Inscription: 9 Jan 2004
des qu'un crawler est passé sur un site, ses infos sont transmises à tous les crawlers.
si un googlebot passe sur ton site, tous les autres robots (ips) auront les infos, et heureusement.
donc, oui, le robots.txt se propage à tous les spiders d'un meme moteur
si un googlebot passe sur ton site, tous les autres robots (ips) auront les infos, et heureusement.
donc, oui, le robots.txt se propage à tous les spiders d'un meme moteur
- pr tournesol
- Nouveau WRInaute

- Messages: 3
- Inscription: 12 Juil 2005
KaZhaR, merci pour ta réponse qui est on ne peut plus claire.
Sais-tu si il est possible de détécter tous ces robots de manière certaine par leur ip ?
Par exemple en comparant seulement les 3 premières séries de chiffre de l'ip précédement trappée et de la nouvelle qui se présente ?
Ou bien Google peut-il tout simplement passer la première fois lire le robots.txt 164.71.1.149 et propager l'info à 216.239.41.98
(c'est un exemple !).
En gros : le robots.txt se propage-t-il entre toutes les fermes...?
Merci...
Sais-tu si il est possible de détécter tous ces robots de manière certaine par leur ip ?
Par exemple en comparant seulement les 3 premières séries de chiffre de l'ip précédement trappée et de la nouvelle qui se présente ?
Ou bien Google peut-il tout simplement passer la première fois lire le robots.txt 164.71.1.149 et propager l'info à 216.239.41.98
(c'est un exemple !).
En gros : le robots.txt se propage-t-il entre toutes les fermes...?
Merci...
- dmathieu
- Modérateur

- Messages: 7244
- Inscription: 9 Jan 2004
entre toutes les fermes ??
entre les différents moteurs ?
bien sur, google va aller donner ses informations d'indexation à msn ...
non bien evidemment que non, ca se propage pas entre moteurs.
apres, pour avoir la liste de tous les robots, je te conseille tout simplement d'installer robostats, il y a un forum prévu pour sur wri, et tu a une table avec toutes les ips connues.
il suffit apres de surveiller regulierement, si il n'y en a pas de nouvelles
entre les différents moteurs ?
bien sur, google va aller donner ses informations d'indexation à msn ...
non bien evidemment que non, ca se propage pas entre moteurs.
apres, pour avoir la liste de tous les robots, je te conseille tout simplement d'installer robostats, il y a un forum prévu pour sur wri, et tu a une table avec toutes les ips connues.
il suffit apres de surveiller regulierement, si il n'y en a pas de nouvelles
4 messages
• Page 1 sur 1
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Propagation DNS
- Propagation de modification de contenu
- Problème de propagation de DNS
- Propagation entre Datacenters
- Propagation des virus?
- Temps de propagation des DNS ?
- Propagation toujours pas stable
- Propagation des DNS interminable...
- Neuf télécom et propagation de DNS
- Vérifier la propagation d'un DNS ?
- Sortie de GoogleStats v2.01 - 02-03-2003
- Les crawlers de Yahoo! - 18-03-2004
- Google rachète SocialDeck (jeux sur mobiles) - 31-08-2010
- Les robots MSNbot de Live Search - 30-11-2006
- Déclarer son fichier sitemap dans le fichier robots.txt - 16-04-2007
- Petit changement pour Slurp (le robot de Yahoo) - 29-03-2007
- La balise meta NOYDIR de Yahoo - 05-03-2007
- Robots.txt : Yahoo supporte les options avancées - 04-11-2006
Consultez la description détaillée des produits ou services de Google suivants : Google TrustRank
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 1 invité
