Astuce qui permet d'être (enfin) visité par MSN-bot !
34 messages • Page 2 sur 3 • 1, 2, 3
Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics
Toutou-Fr a écrit:Moi qui ai refait récemment l'url rewriting de mon site en mettant des "-" ..j'hésite entre laisser tomber, me pendre, et prier pour que MSN Bot se fasse plus compréhensif![]()
Je suis dans le meme cas que toi.
C'est bien embetant.
Si vous avez des solutions n'hesité pas.
J'ai trouvé une solution pas trop contraignante pour pouvoir changer facilement le caractères qui me sert.
Je l'ai défini dans une constante.
Ainsi, si je veux le changer, je ne change que le contenu de la constante et le fichier .htaccess
ça permet de gagner beaucoup de temps et évite les recherches fastidieuse dans le code.
J'ai remplacé le "-" par une virgule.
Je l'ai défini dans une constante.
Ainsi, si je veux le changer, je ne change que le contenu de la constante et le fichier .htaccess
ça permet de gagner beaucoup de temps et évite les recherches fastidieuse dans le code.
J'ai remplacé le "-" par une virgule.
Moi qui ai refait récemment l'url rewriting de mon site en mettant des "-" ..j'hésite entre laisser tomber, me pendre, et prier pour que MSN Bot se fasse plus compréhensif Shocked
C'est toujours comme ça avec les produits / services M*cr*s*ft ! Si tu espère qu'un jour MSN Bot se fasse plus compréhensif tu peux te faire moine et prier toute ta vie, d'ailleur si tu remplace tes '-' par des ',' tu paus être sur que dans trous mois ça pausera aussi des problèmes et un jour il restera plus que les '\\\' mais là se sera emmerdant parceque incompatible avec W*nd*ws...
Ne te pend pas se serait dommage.
Par élimination il ne te reste plus qu'a laisser tomber
RFC 3986 URI Generic Syntax January 2005
reserved = gen-delims / sub-delims
gen-delims = ":" / "/" / "?" / "#" / "[" / "]" / "@"
sub-delims = "!" / "$" / "&" / "'" / "(" / ")"
/ "*" / "+" / "," / ";" / "="
The purpose of reserved characters is to provide a set of delimiting
characters that are distinguishable from other data within a URI.
URIs that differ in the replacement of a reserved character with its
corresponding percent-encoded octet are not equivalent. Percent-
encoding a reserved character, or decoding a percent-encoded octet
that corresponds to a reserved character, will change how the URI is
interpreted by most applications. Thus, characters in the reserved
set are protected from normalization and are therefore safe to be
used by scheme-specific and producer-specific algorithms for
delimiting data subcomponents within a URI.
A subset of the reserved characters (gen-delims) is used as
delimiters of the generic URI components described in Section 3. A
component's ABNF syntax rule will not use the reserved or gen-delims
rule names directly; instead, each syntax rule lists the characters
allowed within that component (i.e., not delimiting it), and any of
those characters that are also in the reserved set are "reserved" for
use as subcomponent delimiters within the component. Only the most
common subcomponents are defined by this specification; other
subcomponents may be defined by a URI scheme's specification, or by
the implementation-specific syntax of a URI's dereferencing
algorithm, provided that such subcomponents are delimited by
characters in the reserved set allowed within that component.
URI producing applications should percent-encode data octets that
correspond to characters in the reserved set unless these characters
are specifically allowed by the URI scheme to represent data in that
component. If a reserved character is found in a URI component and
no delimiting role is known for that character, then it must be
interpreted as representing the data octet corresponding to that
character's encoding in US-ASCII.
2.3. Unreserved Characters
Characters that are allowed in a URI but do not have a reserved
purpose are called unreserved. These include uppercase and lowercase
letters, decimal digits, hyphen, period, underscore, and tilde.
unreserved = ALPHA / DIGIT / "-" / "." / "_" / "~"
Visiblement l'utilisation de la "," n'est pas conseillée... il vaut mieux rester dans les "Unreserved Characters".
J'ai trouvé une solution pas trop contraignante pour pouvoir changer facilement le caractères qui me sert.
Ca tombe bien
- jobetudiant
- WRInaute impliqué

- Messages: 288
- Inscription: Lun Mai 24, 2004 18:12
Je confirme que Google n'aime pas les tirets! J'en avais parlé il y a quelques mois ici et sur mon blog ( http://djouba.jobetudiant.net/index.php ... les-tirets )
Aujourd'hui, cela va un peu mieux, mais MSNBot n'est toujours pas très aventurier... Du moins, sur mon site!
Voili
Aujourd'hui, cela va un peu mieux, mais MSNBot n'est toujours pas très aventurier... Du moins, sur mon site!
Voili
Je confirme aussi: je ne suis pas regulierement msn, mais il a litteralement jete toutes les pages avec des tirets dans le nom de fichier pour plusieurs de mes sites qui etaient il y a peu en tete des resultats
C'est un phenomene recent donc. Reste a savoir si c'est temporaire ou...
Cela fait deja un petit moment que cela me trotte dans la tete: quoi de plus simple pour detecter un site construit de facon non naturelle que de regarder comment sont nommes les fichiers d'une url ? Pourquoi cela n'est-il pas gere par les moteurs ?
A la main, pour une page traitant des fontaines remarquables de paris, on metterai fontaine-paris.html ou fontaineparis.html. avec nos (mauvaises ?) habitudes, nos scripts prennet le titre brut de fonderie et nomment cette page les-fontaines-remarquables-de-paris.html
Bref: des nots non significatifs (les, de) et une palanquee de tirets (4)
Il serait logique qu'un filtre sur ces criteres se generalise, je le crain deja depuis quelques mois
C'est un phenomene recent donc. Reste a savoir si c'est temporaire ou...
Cela fait deja un petit moment que cela me trotte dans la tete: quoi de plus simple pour detecter un site construit de facon non naturelle que de regarder comment sont nommes les fichiers d'une url ? Pourquoi cela n'est-il pas gere par les moteurs ?
A la main, pour une page traitant des fontaines remarquables de paris, on metterai fontaine-paris.html ou fontaineparis.html. avec nos (mauvaises ?) habitudes, nos scripts prennet le titre brut de fonderie et nomment cette page les-fontaines-remarquables-de-paris.html
Bref: des nots non significatifs (les, de) et une palanquee de tirets (4)
Il serait logique qu'un filtre sur ces criteres se generalise, je le crain deja depuis quelques mois
jobetudiant a écrit:Je confirme que Google n'aime pas les tirets! J'en avais parlé il y a quelques mois ici et sur mon blog...
Lors d'une mise a jour de ma re-ecriture d'url, j'avais note une tres legere baisse d'indexation de google. Mais comme cela etait presque insignifiant, j'avais mis ca sur le compte des quintes de toux des data centers
Par contre, je n'irait pas jusqu'a dire qu'il faut les remplacer par des virgules, + ou autres choses. A mon avis cela doit etre volontaire (filtre) et le reste devrait logiquement suivre.
Je pencherai plus pour une construction intelligente des url (1, 2 ou 3 mots significatifs seulenent).
Je suis deja en train de corriger mes modules de reecriture. de toutes facons, cela m'agacait de voire sur certains de mes sites des-url-de-3-kilometres-de-long
Si quelqu'un sait ce qu'il en est des "/", je suis preneur :p.
Last.fm utilise à fond les "/", et autant ça marche bien sur Google (http://www.google.com/search?hl=en&q=site%3Alast.fm) et Yahoo (http://fr.search.yahoo.com/search?fr=fp ... meta=vc%3D), pour MSN, c'est pas trop ça (http://search.msn.com/results.aspx?q=si ... rch_type=0), mais je ne sais pas si c'est du aux "/", où si c'est tout simplement MSN qui de manière générale indexe moins en profondeur.
Last.fm utilise à fond les "/", et autant ça marche bien sur Google (http://www.google.com/search?hl=en&q=site%3Alast.fm) et Yahoo (http://fr.search.yahoo.com/search?fr=fp ... meta=vc%3D), pour MSN, c'est pas trop ça (http://search.msn.com/results.aspx?q=si ... rch_type=0), mais je ne sais pas si c'est du aux "/", où si c'est tout simplement MSN qui de manière générale indexe moins en profondeur.
-

fredoche25 - WRInaute accro

- Messages: 1208
- Inscription: Jeu Mai 27, 2004 8:39
Je confirme que Google n'aime pas les tirets!
décidemment on en apprendra vraiment tous les jours
-

nsnfrancais - Nouveau WRInaute
- Messages: 8
- Inscription: Lun Fév 27, 2006 15:36
Salut à tous
ces interprétations envers les MSN Bots sont intéressantes sur plusieurs points
par expérience je développe plutot de l'url rewriting avec des _ plutot que des - et malgrès ce, on peut toujours constater que les MSN Bots sont moins goulus que les google Bots ou autres
Mais par comparaison, j'ai développé un script permettant de suivre les bots, pensé sur l'idée de robots stats, mais avec comparsions des pages indexées par les robots
là ou le sujet me laisse un peu pensif c'est que autant google, que biglotron ou msn vont sur des pages de type
www.nukescripts.fr/phpnuke-nukescripts-downloads.html
et aussi bien sur des pages de type:
www.nukescripts.fr/nukescriptsdl-phpnuk ... s-814.html
sur l'une on peut constater 2 - et sur l'autre 3 , mais dans tous les cas, les MSN Bots sont bien passés et repasse régulièrement sur les 2 urls
Maintenant il est clair que les MSN Bots sont moins virulants que les autres
à l'instant T voici les stats pour ce même site:
Google Bots 4539
Biglotron 1930
Yahoo Bots 1484
et
MSN Bots 121
Les MSN bots sont sur tous mes sites toujours à la traine, jai tester en ne mettant que des _
puis que des -
puis en accolant tous les mots sans rien entre eux
et ceci sans succès pour les MSN Bots, rien ni fait plus
Mais à la lecture de ce post certains semblent convaincu que des _ seraient mieux que des -
C'est une information qui a toute sont importance mais peut être faut il regarder ailleurs
Par exemple, je me suis aperçu que depuis que j'ai certaines pages valides W3C, les robots semblent ( tous ) y revenir plus souvent
Alors êtes vous en HTML4, XHTML strict ou non valide
perso ce site a des pages valides html4, mais j'ai un autre site en XHTML Strict avec des URL Signifiantes ( toutes avec des _ et le résultat est toujours le même )
Reste une chose à penser, faut il s'inquiéter des MSN Bots
perso je n'en fais pas cas, je préfère travailler sur les passages des google bots qui ont certainement un meilleur retour ( surtout à la vue des stats d'entrée via ce moteur de recherche )
ces interprétations envers les MSN Bots sont intéressantes sur plusieurs points
par expérience je développe plutot de l'url rewriting avec des _ plutot que des - et malgrès ce, on peut toujours constater que les MSN Bots sont moins goulus que les google Bots ou autres
Mais par comparaison, j'ai développé un script permettant de suivre les bots, pensé sur l'idée de robots stats, mais avec comparsions des pages indexées par les robots
là ou le sujet me laisse un peu pensif c'est que autant google, que biglotron ou msn vont sur des pages de type
www.nukescripts.fr/phpnuke-nukescripts-downloads.html
et aussi bien sur des pages de type:
www.nukescripts.fr/nukescriptsdl-phpnuk ... s-814.html
sur l'une on peut constater 2 - et sur l'autre 3 , mais dans tous les cas, les MSN Bots sont bien passés et repasse régulièrement sur les 2 urls
Maintenant il est clair que les MSN Bots sont moins virulants que les autres
à l'instant T voici les stats pour ce même site:
Google Bots 4539
Biglotron 1930
Yahoo Bots 1484
et
MSN Bots 121
Les MSN bots sont sur tous mes sites toujours à la traine, jai tester en ne mettant que des _
puis que des -
puis en accolant tous les mots sans rien entre eux
et ceci sans succès pour les MSN Bots, rien ni fait plus
Mais à la lecture de ce post certains semblent convaincu que des _ seraient mieux que des -
C'est une information qui a toute sont importance mais peut être faut il regarder ailleurs
Par exemple, je me suis aperçu que depuis que j'ai certaines pages valides W3C, les robots semblent ( tous ) y revenir plus souvent
Alors êtes vous en HTML4, XHTML strict ou non valide
perso ce site a des pages valides html4, mais j'ai un autre site en XHTML Strict avec des URL Signifiantes ( toutes avec des _ et le résultat est toujours le même )
Reste une chose à penser, faut il s'inquiéter des MSN Bots
perso je n'en fais pas cas, je préfère travailler sur les passages des google bots qui ont certainement un meilleur retour ( surtout à la vue des stats d'entrée via ce moteur de recherche )
-

nsnfrancais - Nouveau WRInaute
- Messages: 8
- Inscription: Lun Fév 27, 2006 15:36
WebP a écrit:Bonsoir,
C'est quand même incroyable cette histoire de "-" en 2006 !
Il faudrait presque faire partir une pétition... le pire c'est que aussi dans leur intérêt...
WP
re
je ne demande qu'à que croire ce que je peux lire à droite et à gauche, ( et ainsi en faire bénéficier les différentes communautés auxquelles je me rattache ) d'ailleurs pour tester j'ai passer un premier site en _ uniquement afin d'en avoir le coeur net
L'expérience personnelle, après conseil des autres, est souvent le meilleur moyen de s'en persuader
De plus je pense que l'anonymat d'internet ne permet à personne de prendre les autres pour ce qu'il ne sont pas ...
34 messages • Page 2 sur 3 • 1, 2, 3
Formation recommandée sur ce thème :
Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Google Earth et Google Maps concurrencés par MSN Virtual Earth
- Etude de Googlebot, le robot crawler de Google (Fresh Bot, Deep Bot)
- Affichage de la description DMOZ dans MSN Search
- MSN adCenter Incubation Lab (MSN adLab)
- Web Rank Info ouvre un forum dédié à MSN Search
- AOL pourrait remplacer son partenaire Google par MSN
- Windows Live Local et MSN Virtual Earth
- MSN HRS : des éditeurs de MSN évaluent la qualité des sites web
- Affichage de la description DMOZ dans Google
- Lancement confirmé de MSN Search
- astuce pour référencement dans msn + yahoo
- MSN bot !
- Grève du bot de MSN???
- Bug de msn bot ?
- Adresse Ip de MSN bot ?
- MSN Bot alias la fury
- Msn bot il fait quoi?
- Bot MSN passe fort
- MSN Bot... Oui, mais lequel?
- Pompos et Msn bot crawl avec 1 ip
- 2 questions : Msn Bot et Crawls non souhaités...
- MSN bot aspire toute ma bande passante !
- msn bot me compte une visite à chaque passage
- MSN-Bot sait probablement lire les onclick !
- Google Wireless Transcoder : vieux Bot ou nouveau Bot ?
Consultez la description détaillée des produits ou services de Google suivants : Googlebot
- Similarité et duplicate content
Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages). Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation... Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités





le forum