Astuce qui permet d'être (enfin) visité par MSN-bot !

Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics


lothar
WRInaute accro
WRInaute accro
 
Messages: 1524
Inscription: Sam Juil 12, 2003 11:42

Message le Mer Oct 19, 2005 14:31

J'ai toujours utilisé des "." et ça ne pose aucun problème apparemment.


Borower
WRInaute accro
WRInaute accro
 
Messages: 2151
Inscription: Lun Avr 18, 2005 20:58

Message le Mer Oct 19, 2005 19:32

Toutou-Fr a écrit:Moi qui ai refait récemment l'url rewriting de mon site en mettant des "-" ..j'hésite entre laisser tomber, me pendre, et prier pour que MSN Bot se fasse plus compréhensif 8O

8)

Je suis dans le meme cas que toi.
C'est bien embetant.

Si vous avez des solutions n'hesité pas.


medium69
WRInaute accro
WRInaute accro
 
Messages: 2182
Inscription: Sam Mai 07, 2005 9:36

Message le Mer Oct 19, 2005 23:09

J'ai trouvé une solution pas trop contraignante pour pouvoir changer facilement le caractères qui me sert.

Je l'ai défini dans une constante.

Ainsi, si je veux le changer, je ne change que le contenu de la constante et le fichier .htaccess

ça permet de gagner beaucoup de temps et évite les recherches fastidieuse dans le code.

J'ai remplacé le "-" par une virgule.

raoul-5
Nouveau WRInaute
 
Messages: 27
Inscription: Lun Jan 02, 2006 7:00

Message le Sam Jan 07, 2006 16:40

Moi qui ai refait récemment l'url rewriting de mon site en mettant des "-" ..j'hésite entre laisser tomber, me pendre, et prier pour que MSN Bot se fasse plus compréhensif Shocked


C'est toujours comme ça avec les produits / services M*cr*s*ft ! Si tu espère qu'un jour MSN Bot se fasse plus compréhensif tu peux te faire moine et prier toute ta vie, d'ailleur si tu remplace tes '-' par des ',' tu paus être sur que dans trous mois ça pausera aussi des problèmes et un jour il restera plus que les '\\\' mais là se sera emmerdant parceque incompatible avec W*nd*ws...

Ne te pend pas se serait dommage.

Par élimination il ne te reste plus qu'a laisser tomber :) pour une fois tu peux te le permettre car sur les moteurs de recherche *crosoft est loin d'être un leader.

raoul-5
Nouveau WRInaute
 
Messages: 27
Inscription: Lun Jan 02, 2006 7:00

Message le Sam Jan 07, 2006 16:56

RFC 3986 URI Generic Syntax January 2005


reserved = gen-delims / sub-delims

gen-delims = ":" / "/" / "?" / "#" / "[" / "]" / "@"

sub-delims = "!" / "$" / "&" / "'" / "(" / ")"
/ "*" / "+" / "," / ";" / "="

The purpose of reserved characters is to provide a set of delimiting
characters that are distinguishable from other data within a URI.
URIs that differ in the replacement of a reserved character with its
corresponding percent-encoded octet are not equivalent. Percent-
encoding a reserved character, or decoding a percent-encoded octet
that corresponds to a reserved character, will change how the URI is
interpreted by most applications. Thus, characters in the reserved
set are protected from normalization and are therefore safe to be
used by scheme-specific and producer-specific algorithms for
delimiting data subcomponents within a URI.

A subset of the reserved characters (gen-delims) is used as
delimiters of the generic URI components described in Section 3. A
component's ABNF syntax rule will not use the reserved or gen-delims
rule names directly; instead, each syntax rule lists the characters
allowed within that component (i.e., not delimiting it), and any of
those characters that are also in the reserved set are "reserved" for
use as subcomponent delimiters within the component. Only the most
common subcomponents are defined by this specification; other
subcomponents may be defined by a URI scheme's specification, or by
the implementation-specific syntax of a URI's dereferencing
algorithm, provided that such subcomponents are delimited by
characters in the reserved set allowed within that component.

URI producing applications should percent-encode data octets that
correspond to characters in the reserved set unless these characters
are specifically allowed by the URI scheme to represent data in that
component. If a reserved character is found in a URI component and
no delimiting role is known for that character, then it must be
interpreted as representing the data octet corresponding to that
character's encoding in US-ASCII.

2.3. Unreserved Characters

Characters that are allowed in a URI but do not have a reserved
purpose are called unreserved. These include uppercase and lowercase
letters, decimal digits, hyphen, period, underscore, and tilde.

unreserved = ALPHA / DIGIT / "-" / "." / "_" / "~"


Visiblement l'utilisation de la "," n'est pas conseillée... il vaut mieux rester dans les "Unreserved Characters".

J'ai trouvé une solution pas trop contraignante pour pouvoir changer facilement le caractères qui me sert.

Ca tombe bien ;)

CyrilS
Nouveau WRInaute
 
Messages: 29
Inscription: Mer Jan 18, 2006 17:42

Message le Jeu Jan 26, 2006 9:43

Mouais et donc bref entre la virgule, le point et le plus, mon coeur balance...

Toujours pas de tests clairs sur le sujet ?

jobetudiant
WRInaute impliqué
WRInaute impliqué
 
Messages: 288
Inscription: Lun Mai 24, 2004 18:12

Message le Jeu Jan 26, 2006 9:45

Je confirme que Google n'aime pas les tirets! J'en avais parlé il y a quelques mois ici et sur mon blog ( http://djouba.jobetudiant.net/index.php ... les-tirets )

Aujourd'hui, cela va un peu mieux, mais MSNBot n'est toujours pas très aventurier... Du moins, sur mon site!

Voili


itsme
WRInaute passionné
WRInaute passionné
 
Messages: 744
Inscription: Mer Oct 13, 2004 14:13

Message le Jeu Jan 26, 2006 10:02

Je confirme aussi: je ne suis pas regulierement msn, mais il a litteralement jete toutes les pages avec des tirets dans le nom de fichier pour plusieurs de mes sites qui etaient il y a peu en tete des resultats 8O

C'est un phenomene recent donc. Reste a savoir si c'est temporaire ou...

Cela fait deja un petit moment que cela me trotte dans la tete: quoi de plus simple pour detecter un site construit de facon non naturelle que de regarder comment sont nommes les fichiers d'une url ? Pourquoi cela n'est-il pas gere par les moteurs ?

A la main, pour une page traitant des fontaines remarquables de paris, on metterai fontaine-paris.html ou fontaineparis.html. avec nos (mauvaises ?) habitudes, nos scripts prennet le titre brut de fonderie et nomment cette page les-fontaines-remarquables-de-paris.html
Bref: des nots non significatifs (les, de) et une palanquee de tirets (4)

Il serait logique qu'un filtre sur ces criteres se generalise, je le crain deja depuis quelques mois :?


itsme
WRInaute passionné
WRInaute passionné
 
Messages: 744
Inscription: Mer Oct 13, 2004 14:13

Message le Jeu Jan 26, 2006 10:10

jobetudiant a écrit:Je confirme que Google n'aime pas les tirets! J'en avais parlé il y a quelques mois ici et sur mon blog...

Lors d'une mise a jour de ma re-ecriture d'url, j'avais note une tres legere baisse d'indexation de google. Mais comme cela etait presque insignifiant, j'avais mis ca sur le compte des quintes de toux des data centers :)

Par contre, je n'irait pas jusqu'a dire qu'il faut les remplacer par des virgules, + ou autres choses. A mon avis cela doit etre volontaire (filtre) et le reste devrait logiquement suivre.

Je pencherai plus pour une construction intelligente des url (1, 2 ou 3 mots significatifs seulenent).

Je suis deja en train de corriger mes modules de reecriture. de toutes facons, cela m'agacait de voire sur certains de mes sites des-url-de-3-kilometres-de-long :)


wullon
WRInaute accro
WRInaute accro
 
Messages: 3914
Inscription: Sam Sep 18, 2004 15:06

Message le Jeu Jan 26, 2006 20:44

Si quelqu'un sait ce qu'il en est des "/", je suis preneur :p.

Last.fm utilise à fond les "/", et autant ça marche bien sur Google (http://www.google.com/search?hl=en&q=site%3Alast.fm) et Yahoo (http://fr.search.yahoo.com/search?fr=fp ... meta=vc%3D), pour MSN, c'est pas trop ça (http://search.msn.com/results.aspx?q=si ... rch_type=0), mais je ne sais pas si c'est du aux "/", où si c'est tout simplement MSN qui de manière générale indexe moins en profondeur.


fredoche25
WRInaute accro
WRInaute accro
 
Messages: 1208
Inscription: Jeu Mai 27, 2004 8:39

Message le Jeu Jan 26, 2006 20:47

Je confirme que Google n'aime pas les tirets!


décidemment on en apprendra vraiment tous les jours :?


nsnfrancais
Nouveau WRInaute
 
Messages: 8
Inscription: Lun Fév 27, 2006 15:36

Message le Lun Fév 27, 2006 16:18

Salut à tous

ces interprétations envers les MSN Bots sont intéressantes sur plusieurs points

par expérience je développe plutot de l'url rewriting avec des _ plutot que des - et malgrès ce, on peut toujours constater que les MSN Bots sont moins goulus que les google Bots ou autres

Mais par comparaison, j'ai développé un script permettant de suivre les bots, pensé sur l'idée de robots stats, mais avec comparsions des pages indexées par les robots

là ou le sujet me laisse un peu pensif c'est que autant google, que biglotron ou msn vont sur des pages de type
www.nukescripts.fr/phpnuke-nukescripts-downloads.html

et aussi bien sur des pages de type:
www.nukescripts.fr/nukescriptsdl-phpnuk ... s-814.html

sur l'une on peut constater 2 - et sur l'autre 3 , mais dans tous les cas, les MSN Bots sont bien passés et repasse régulièrement sur les 2 urls

Maintenant il est clair que les MSN Bots sont moins virulants que les autres

à l'instant T voici les stats pour ce même site:
Google Bots 4539
Biglotron 1930
Yahoo Bots 1484

et
MSN Bots 121

Les MSN bots sont sur tous mes sites toujours à la traine, jai tester en ne mettant que des _

puis que des -
puis en accolant tous les mots sans rien entre eux
et ceci sans succès pour les MSN Bots, rien ni fait plus

Mais à la lecture de ce post certains semblent convaincu que des _ seraient mieux que des -

C'est une information qui a toute sont importance mais peut être faut il regarder ailleurs

Par exemple, je me suis aperçu que depuis que j'ai certaines pages valides W3C, les robots semblent ( tous ) y revenir plus souvent

Alors êtes vous en HTML4, XHTML strict ou non valide

perso ce site a des pages valides html4, mais j'ai un autre site en XHTML Strict avec des URL Signifiantes ( toutes avec des _ et le résultat est toujours le même )

Reste une chose à penser, faut il s'inquiéter des MSN Bots :)
perso je n'en fais pas cas, je préfère travailler sur les passages des google bots qui ont certainement un meilleur retour ( surtout à la vue des stats d'entrée via ce moteur de recherche )

boussole
WRInaute passionné
WRInaute passionné
 
Messages: 566
Inscription: Mar Jan 06, 2004 16:23

Message le Lun Fév 27, 2006 19:08

Pour mon experience selon Xiti, Yahoo augmente depuis 3 jours (+999%) de trafic. En passant de _ au - dans mes pages rewritees. Par contre j'ai baisse avec MSN

WebP
Nouveau WRInaute
 
Messages: 39
Inscription: Lun Fév 27, 2006 13:28

Message le Lun Fév 27, 2006 19:55

Bonsoir,

C'est quand même incroyable cette histoire de "-" en 2006 !

Il faudrait presque faire partir une pétition... le pire c'est que aussi dans leur intérêt...

WP


nsnfrancais
Nouveau WRInaute
 
Messages: 8
Inscription: Lun Fév 27, 2006 15:36

Message le Mar Fév 28, 2006 0:19

WebP a écrit:Bonsoir,

C'est quand même incroyable cette histoire de "-" en 2006 !

Il faudrait presque faire partir une pétition... le pire c'est que aussi dans leur intérêt...

WP


re :)

je ne demande qu'à que croire ce que je peux lire à droite et à gauche, ( et ainsi en faire bénéficier les différentes communautés auxquelles je me rattache ) d'ailleurs pour tester j'ai passer un premier site en _ uniquement afin d'en avoir le coeur net :)

L'expérience personnelle, après conseil des autres, est souvent le meilleur moyen de s'en persuader :)

De plus je pense que l'anonymat d'internet ne permet à personne de prendre les autres pour ce qu'il ne sont pas ...

Astuce qui permet d'être (enfin) visité par MSN-bot ! Astuce qui permet d'être (enfin) visité par MSN-bot !

Formation recommandée sur ce thème :

Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :

Consultez la description détaillée des produits ou services de Google suivants : Googlebot

  • Similarité et duplicate content
    Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages). Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation... Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués.


Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités