Propagation du robots.txt ?

Règles du forum
Attention ce forum est destiné avant tout à ceux qui découvrent le référencement. Les membres qui auront l'amabilité de répondre à leurs questions sont priés de rester courtois, polis, indulgents, patients et pédagogues... Merci d'avance !

Par ailleurs, inutile d'utiliser ce forum uniquement pour obtenir des liens vers vos sites, les liens sont désactivés pour le référencement (nofollow).

Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics

pr tournesol
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 3
Inscription: 12 Juil 2005

Propagation du robots.txt ?

Message le Mar Juil 19, 2005 19:50

Bonjour à tous,

Je viens de mettre en place su mon site en place un sytème pour détécter les accès des robots au robots.txt. Grâce à ce système, j'enregistre les IPs dans une base, et je pourrai donc les suivre tout au long de leur visite.

Le problème, c'est que d'après ce que j'ai pu lire partout sur les forums, les robots ne passent pas à chaque fois dans robots.txt.

D'ou, m'a question : savez-vous si google ou slurp, etc... peuvent après avoir lu le robots.txt une première fois, revenir lors d'un crawl ultérieur avec une adresse DIFFERENTE de celle utilisée la première fois, et ceci SANS passer par le robots.txt ?

En gros, le robots.txt se propage-t-il dans les fermes de spiders ou est-ce que chacun gère sa propre copie de robots.txt ?

Merci si vous avez des réponses... et bonne vacances à tous !

dmathieu
Modérateur
Modérateur
 
Messages: 7244
Inscription: 9 Jan 2004

Message le Mar Juil 19, 2005 19:52

des qu'un crawler est passé sur un site, ses infos sont transmises à tous les crawlers.
si un googlebot passe sur ton site, tous les autres robots (ips) auront les infos, et heureusement.
donc, oui, le robots.txt se propage à tous les spiders d'un meme moteur

pr tournesol
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 3
Inscription: 12 Juil 2005

Message le Mar Juil 19, 2005 21:16

KaZhaR, merci pour ta réponse qui est on ne peut plus claire.

Sais-tu si il est possible de détécter tous ces robots de manière certaine par leur ip ?
Par exemple en comparant seulement les 3 premières séries de chiffre de l'ip précédement trappée et de la nouvelle qui se présente ?
Ou bien Google peut-il tout simplement passer la première fois lire le robots.txt 164.71.1.149 et propager l'info à 216.239.41.98
(c'est un exemple !).

En gros : le robots.txt se propage-t-il entre toutes les fermes...?

Merci...

dmathieu
Modérateur
Modérateur
 
Messages: 7244
Inscription: 9 Jan 2004

Message le Mar Juil 19, 2005 21:21

entre toutes les fermes ??
entre les différents moteurs ?
bien sur, google va aller donner ses informations d'indexation à msn ... :roll:
non bien evidemment que non, ca se propage pas entre moteurs.

apres, pour avoir la liste de tous les robots, je te conseille tout simplement d'installer robostats, il y a un forum prévu pour sur wri, et tu a une table avec toutes les ips connues.
il suffit apres de surveiller regulierement, si il n'y en a pas de nouvelles


Si vous avez aimé cette discussion, partagez-la sur vos réseaux sociaux préférés :

Formation recommandée sur ce thème :

Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 1 invité