Robots Textes
18 messages • Page 1 sur 2 • 1, 2
Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics
-

pascal1973 - WRInaute passionné

- Messages: 982
- Inscription: Sam Sep 24, 2005 20:58
Robots Textes
Salut à tous
Je voudrais savoir comment elaborer un fichier robots text?
Quels users agents insérer ?
à+++
Je voudrais savoir comment elaborer un fichier robots text?
Quels users agents insérer ?
à+++
-

freetopien - WRInaute passionné

- Messages: 942
- Inscription: Dim Aoû 27, 2006 11:50
Si tu veux touts les robots tu met dans robots.txt (ya til un s à robots.txt ? a confirmer...)
User-agent: *
Cela autorise tous les robots à visiter tout ton site
si tu le fais suivre de :
Disallow: /private
tu leur dis de ne jamais aller sur le dossier /private (qui est à la racine de ton site)
# ceci est un commentaire que tu peux mettre dans ton fichier qui sera
# ignoré par les robots
Au final ça donne dans robots.txt :
# ceci est le contenu de mon fichier robots.txt qui autorise les robots à
# indexer mon site mais leur interdit d'aller dans le repertoire private
User-agent: *
Disallow: /private
voilà, dis nous quoi
User-agent: *
Cela autorise tous les robots à visiter tout ton site
si tu le fais suivre de :
Disallow: /private
tu leur dis de ne jamais aller sur le dossier /private (qui est à la racine de ton site)
# ceci est un commentaire que tu peux mettre dans ton fichier qui sera
# ignoré par les robots
Au final ça donne dans robots.txt :
# ceci est le contenu de mon fichier robots.txt qui autorise les robots à
# indexer mon site mais leur interdit d'aller dans le repertoire private
User-agent: *
Disallow: /private
voilà, dis nous quoi
Dernière édition par freetopien le Dim Sep 10, 2006 13:01, édité 2 fois.
-

pascal1973 - WRInaute passionné

- Messages: 982
- Inscription: Sam Sep 24, 2005 20:58
freetopien a écrit:Si tu veux touts les robots tu met dans robots.txt (ya til un s à robots.txt ? a confirmer...)
User-agent: *
Cela autorise tous les robots à visiter tout ton site
si tu le fais suivre de :
Disallow: /private
tu leur dis de ne jamais aller sur le dossier /private (qui est à la racine de ton site)
# ceci est un commentaire que tu peux mettre dans ton fichier
voilà, dis nous quoi
Salut , dsl mais j'ai pas tout suivi
-

freetopien - WRInaute passionné

- Messages: 942
- Inscription: Dim Aoû 27, 2006 11:50
# ceci est le contenu de mon fichier robots.txt qui autorise tous les robots à indexer mon site mais leur interdit
# d'aller dans le repertoire private
# les lignes qui ont un # comme 1er caractère seront ignorés par les
# robots car ils sont considérés comme des commentaires (inutiles pour le robot donc)
User-agent: *
Disallow: /private
ca ira ?
# d'aller dans le repertoire private
# les lignes qui ont un # comme 1er caractère seront ignorés par les
# robots car ils sont considérés comme des commentaires (inutiles pour le robot donc)
User-agent: *
Disallow: /private
ca ira ?
J'avais trouvé un robot.txt avec pas mal de robots "indésirables" que tu peux interdire de visites sur ton site.
Je ne sais pas si tous ces robots sont encore d'actualités mais je mets le fichier si ça peut aider.

Je ne sais pas si tous ces robots sont encore d'actualités mais je mets le fichier si ça peut aider.
- Code: Tout sélectionner
User-agent: *
User-agent: BotRightHere
Disallow: /
User-agent: WebZip
Disallow: /
User-agent: larbin
Disallow: /
User-agent: b2w/0.1
Disallow: /
User-agent: Copernic
Disallow: /
User-agent: psbot
Disallow: /
User-agent: Python-urllib
Disallow: /
User-agent: NetMechanic
Disallow: /
User-agent: URL_Spider_Pro
Disallow: /
User-agent: CherryPicker
Disallow: /
User-agent: EmailCollector
Disallow: /
User-agent: EmailSiphon
Disallow: /
User-agent: WebBandit
Disallow: /
User-agent: EmailWolf
Disallow: /
User-agent: ExtractorPro
Disallow: /
User-agent: CopyRightCheck
Disallow: /
User-agent: Crescent
Disallow: /
User-agent: SiteSnagger
Disallow: /
User-agent: ProWebWalker
Disallow: /
User-agent: CheeseBot
Disallow: /
User-agent: LNSpiderguy
Disallow: /
User-agent: Alexibot
Disallow: /
User-agent: Teleport
Disallow: /
User-agent: TeleportPro
Disallow: /
User-agent: MIIxpc
Disallow: /
User-agent: Telesoft
Disallow: /
User-agent: Website Quester
Disallow: /
User-agent: WebZip
Disallow: /
User-agent: moget/2.1
Disallow: /
User-agent: WebZip/4.0
Disallow: /
User-agent: WebStripper
Disallow: /
User-agent: WebSauger
Disallow: /
User-agent: WebCopier
Disallow: /
User-agent: NetAnts
Disallow: /
User-agent: Mister PiX
Disallow: /
User-agent: WebAuto
Disallow: /
User-agent: TheNomad
Disallow: /
User-agent: WWW-Collector-E
Disallow: /
User-agent: RMA
Disallow: /
User-agent: libWeb/clsHTTP
Disallow: /
User-agent: asterias
Disallow: /
User-agent: httplib
Disallow: /
User-agent: turingos
Disallow: /
User-agent: spanner
Disallow: /
User-agent: InfoNaviRobot
Disallow: /
User-agent: Harvest/1.5
Disallow: /
User-agent: Bullseye/1.0
Disallow: /
User-agent: Mozilla/4.0 (compatible; BullsEye; Windows 95)
Disallow: /
User-agent: Crescent Internet ToolPak HTTP OLE Control v.1.0
Disallow: /
User-agent: CherryPickerSE/1.0
Disallow: /
User-agent: CherryPickerElite/1.0
Disallow: /
User-agent: WebBandit/3.50
Disallow: /
User-agent: NICErsPRO
Disallow: /
User-agent: Microsoft URL Control - 5.01.4511
Disallow: /
User-agent: DittoSpyder
Disallow: /
User-agent: Foobot
Disallow: /
User-agent: SpankBot
Disallow: /
User-agent: BotALot
Disallow: /
User-agent: lwp-trivial/1.34
Disallow: /
User-agent: lwp-trivial
Disallow: /
User-agent: BunnySlippers
Disallow: /
User-agent: Microsoft URL Control - 6.00.8169
Disallow: /
User-agent: URLy Warning
Disallow: /
User-agent: Wget/1.6
Disallow: /
User-agent: Wget/1.5.3
Disallow: /
User-agent: Wget
Disallow: /
User-agent: LinkWalker
Disallow: /
User-agent: cosmos
Disallow: /
User-agent: moget
Disallow: /
User-agent: hloader
Disallow: /
User-agent: humanlinks
Disallow: /
User-agent: LinkextractorPro
Disallow: /
User-agent: Offline Explorer
Disallow: /
User-agent: Mata Hari
Disallow: /
User-agent: LexiBot
Disallow: /
User-agent: Web Image Collector
Disallow: /
User-agent: The Intraformant
Disallow: /
User-agent: True_Robot/1.0
Disallow: /
User-agent: True_Robot
Disallow: /
User-agent: BlowFish/1.0
Disallow: /
User-agent: JennyBot
Disallow: /
User-agent: MIIxpc/4.2
Disallow: /
User-agent: BuiltBotTough
Disallow: /
User-agent: ProPowerBot/2.14
Disallow: /
User-agent: BackDoorBot/1.0
Disallow: /
User-agent: toCrawl/UrlDispatcher
Disallow: /
User-agent: suzuran
Disallow: /
User-agent: TightTwatBot
Disallow: /
User-agent: VCI WebViewer VCI WebViewer Win32
Disallow: /
User-agent: VCI
Disallow: /
User-agent: Szukacz/1.4
Disallow: /
User-agent: Openfind data gatherer
Disallow: /
User-agent: Openfind
Disallow: /
User-agent: Xenu's Link Sleuth 1.1c
Disallow: /
User-agent: Xenu's
Disallow: /
User-agent: Zeus
Disallow: /
User-agent: RepoMonkey Bait & Tackle/v1.01
Disallow: /
User-agent: RepoMonkey
Disallow: /
User-agent: Microsoft URL Control
Disallow: /
User-agent: Openbot
Disallow: /
User-agent: URL Control
Disallow: /
User-agent: Zeus Link Scout
Disallow: /
User-agent: Zeus 32297 Webster Pro V2.9 Win32
Disallow: /
User-agent: Webster Pro
Disallow: /
User-agent: EroCrawler
Disallow: /
User-agent: LinkScan/8.1a Unix
Disallow: /
User-agent: Keyword Density/0.9
Disallow: /
User-agent: Kenjin Spider
Disallow: /
User-agent: Iron33/1.0.2
Disallow: /
User-agent: Bookmark search tool
Disallow: /
User-agent: GetRight/4.2
Disallow: /
User-agent: FairAd Client
Disallow: /
User-agent: Gaisbot
Disallow: /
User-agent: Aqua_Products
Disallow: /
User-agent: Radiation Retriever 1.1
Disallow: /
User-agent: Flaming AttackBot
Disallow: /
-

freetopien - WRInaute passionné

- Messages: 942
- Inscription: Dim Aoû 27, 2006 11:50
Salut keroin,
En quoi ces robots sont indésirables stp ?
Ou si quelqu'un d'autre le sait...
Merci !
En quoi ces robots sont indésirables stp ?
Ou si quelqu'un d'autre le sait...
Merci !
He bien un bot peut être "gentil" (google bot, yahoo slurp,...) ou "méchant" c'est à dire scanner ton site non pas pour l'indexer dans un moteur de recherche mais pour trouver une faille de sécurité ou pour l'inonder de spam (formulaire contact, messages spams dans les forums,...)
-

freetopien - WRInaute passionné

- Messages: 942
- Inscription: Dim Aoû 27, 2006 11:50
ok donc ce sont soit des robots chercheurs de failles ou spammeurs, je les met tous sans hésité alors? ok..
Edit : 50e message !
Edit : 50e message !
Oui sans problème, c'est le fichier robot.txt que j'utilise sur mon forum seulement comme je le disais plus haut cela fait assez longtemps que je l'utilise donc il est plus que possible que de nombreux nouveaux bots non listés aient vu le jour et que certains de cette liste soient obsolètes mais bon ça fait déjà un filtre...
-

freetopien - WRInaute passionné

- Messages: 942
- Inscription: Dim Aoû 27, 2006 11:50
Nan mais je viens juste de penser, ça ne sert à rien !!!
Des robots tels que ceci ne respecte pas les rêgles de robots.txt. C'est d'une logique imparable !!!
Des robots tels que ceci ne respecte pas les rêgles de robots.txt. C'est d'une logique imparable !!!
-

freetopien - WRInaute passionné

- Messages: 942
- Inscription: Dim Aoû 27, 2006 11:50
Je pense tout simplement que ces robots sont programmés par des humains, qui plus est, malhonnêtes.
C'est pour cela que je pense que leur algorithme procède ainsi :
SI
http://www.site.com a robots.txt
ALORS
Ne pas prendre en compte robots.txt
(voir même:) Aller espionner les dossiers interdit
FIN SI
Non ?
C'est pour cela que je pense que leur algorithme procède ainsi :
SI
http://www.site.com a robots.txt
ALORS
Ne pas prendre en compte robots.txt
(voir même:) Aller espionner les dossiers interdit
FIN SI
Non ?
keroin a écrit:freetopien a écrit:Nan mais je viens juste de penser, ça ne sert à rien !!!
Des robots tels que ceci ne respecte pas les rêgles de robots.txt. C'est d'une logique imparable !!!
Huu ??? Tu peux développer ta "logique stp" ?
Je pense qu'il veut dire que le respect des règles édictées dans le robot.txt n'est pas obligatoire.
Chaque robot choisit de le lire ou pas, de le respecter ou non.
Il est peu probable qu'un crawler dont le but est de spammer choisisse de le respecter...
18 messages • Page 1 sur 2 • 1, 2
Formation recommandée sur ce thème :
Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Des informations sur l'algorithme de Yahoo Search fournies par Priyank Garg
- Sortie de GoogleStats v2.01
- Les crawlers de Yahoo!
- Les robots MSNbot de Live Search
- Optimiser le nombre de mots dans les textes de liens
- Déclarer son fichier sitemap dans le fichier robots.txt
- Petit changement pour Slurp (le robot de Yahoo)
- Robots.txt : Yahoo supporte les options avancées
- La balise meta NOYDIR de Yahoo
- Brevet de Microsoft sur l'analyse des textes de backlinks
- Copie de mes textes
- Protéger ses textes
- script de comparaison de textes
- Réécriture de textes et référencement
- Textes de loi et droits de reproduction
- Textes de loi française Marque déposée
- Publication de textes amateurs en ligne
- Personnalisation des textes d'annonces
- Certaines lignes de textes apparaissent mal
- Liens textes de parrainage en français
- Textes litéraires à passage érotique
- Interet des textes cachés ?
- [SQL] recherche textes similaires
- liens textes payant pour augmenter le PR
- Textes Google search devenu en anglais ?
- Transformer des simples citations de votre site en liens
Cet outil vous permet de trouver des pages citant votre site mais ne faisant pas (encore) de lien. Il suffira parfois d'un simple mail pour transformer cette simple citation en lien (backlink).
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités




le forum