Yahoo autorise les wildcards dans robots.txt

Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics


AW
WRInaute accro
WRInaute accro
 
Messages: 2274
Inscription: Mar Mai 31, 2005 14:41

Yahoo autorise les wildcards dans robots.txt

Message le Ven Nov 03, 2006 9:22

Il est maintenant possible d'utiliser les caracteres : * et $ dans robots.txt pour yahoo

Le * est un wildcard, c'est à dire que ça peut etre remplacé par n'importe quel terme, si on reprend l'exemple du blog de yahoo search :

Code: Tout sélectionner
Disallow: /*_print*.html


cette ligne empeche l'accès aux bots à tous fichiers/dossier comprenant _print ou se terminant .html. Par exemple il n'auront pas accès à '/card_print.html' ou '/store_print/product.html'

Le $ sert a marquer la fin d'une l'url, ce code :

Code: Tout sélectionner
Disallow: /*.gif$


Bloque l'accès a tous les fichiers se terminant par .gif sans le $ ça correspondrait à tous les fichiers comprenant .gif

source : http://www.ysearchblog.com


lothar
WRInaute accro
WRInaute accro
 
Messages: 1524
Inscription: Sam Juil 12, 2003 11:42

Message le Ven Nov 03, 2006 9:32

Très intéressant.

Par contre que se passe-t-il si l'on indique
Code: Tout sélectionner
Disallow: /*_print*.html


sans préciser le user-agent du robot Yahoo ?

En clair, ces wildcards poseront-ils problème avec les autres moteurs ?


Serious
WRInaute accro
WRInaute accro
 
Messages: 2438
Inscription: Lun Nov 21, 2005 18:29

Message le Ven Nov 03, 2006 9:41

Du gros n'importe quoi.
Ni compatible avec le standard, ni compatible avec le brouillon RFC, ni compatible avec Google. Il serait peut-etre temps que le W3C se bouge.


dd32
Modérateur
Modérateur
 
Messages: 3262
Inscription: Ven Sep 09, 2005 10:21

Message le Ven Nov 03, 2006 10:15

lothar> Si tu lis l'adresse que AW a pris soin d'indiquer tu remarqueras ce qui suit :wink: :
You can now use '*' in robots directives for Yahoo! Slurp to wildcard match a sequence of characters in your URL. You can use this symbol in any part of the URL string you provide in the robots directive. For example,

User-Agent: Yahoo! Slurp
Allow: /public*/
Disallow: /*_print*.html
Disallow: /*?sessionid

Et donc que le user-agent est précisé


AW
WRInaute accro
WRInaute accro
 
Messages: 2274
Inscription: Mar Mai 31, 2005 14:41

Message le Ven Nov 03, 2006 10:25

il me semble que c'est aussi valable pour googlebot et qu'il comprend les wildcards depuis un bon petit moment

Je confirme : http://www.google.com/support/webmaster ... swer=40367

Et il me semble aussi que pour msn c'est ok

edit : http://search.msn.com/docs/siteowner.as ... Site.htm#B


Formation recommandée sur ce thème :

Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :

Consultez la description détaillée des produits ou services de Google suivants : Google Sitemaps

  • Analyser le positionnement dans Yahoo
    Cet outil vous permet de vérifier si une ou plusieurs page(s) de votre site arrive(nt) dans les premiers résultats de Yahoo, pour certains mots-clés recherchés.
  • Analyser le positionnement d'un site
    AgentWebRanking est un logiciel professionnel qui permet d'analyser le positionnement d'un ou plusieurs sites dans plus de 300 moteurs de recherche dans le monde. Vous pouvez ainsi analyser les performances du référencement pour de nombreux mots-clés.


Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités