tiret bas ou haut ?

WRInaute impliqué
pourquoi n'a-t-il pas choisi des tirets hauts plutôt ?
quelqu'un pourrait m'expliquer son choix ? est-ce mieux pour le referencement ou non ?

C'est simple. Généralement, on utilise généralement le tiret (-) pour séparer les variables lorsqu'on utilise l'url rewriting. De ce fait, ces variables ne peuvent contenir des tirets sinon ça ferai bugger l'url rewriting; du coup, on utilise des underscores (_) car Google distingue également des mots séparés par des underscores, dans une url.

Par exemple: https://www.google.fr/search?sourceid=na ... e+constant
Mon site est le deuxième, on y voit très bien que google distingue les mots séparés par des underscores.

Loïc.
 
WRInaute impliqué
Sur cela Bonne nuit Wink
Question rapidité de réponse, t'es au top 8) . C'est vrai que je te doit le respect car tu est quand même à 1500 messages :roll:

Si tu regarde bien, l'url comporte des caractères en gras, c'est bien que, d'une certaine façon, google parvient à distinguer les mots séparés par des underscores.

Sur ce, bonne nuit :wink: .
 
WRInaute discret
cleden a dit:
non cleden...
Ah bon, j'avais cru voir que jean et marie était en gras dans l'url, ceci ne signifie-t-il pas que google peut distinguer deux mots séparés par un underscore ? 8O
Loïc.

La mise en gras ne fait pas partie de l'algo mais est un traitement à posterori sur la page de résultat.
En fait, google te fait "croire" qu'il voit le mot clé dans l'url, mais la recherche était facile, c'est toi qui lui a demandé de rechercher la chaine dans une page déjà traitée...
Ben oui, c'est des p'tis malins chez GG :wink:
 
WRInaute accro
Si tu regarde bien, l'url comporte des caractères en gras, c'est bien que, d'une certaine façon, google parvient à distinguer les mots séparés par des underscores.

C'est le piège classique :wink: Si tu relis l'article cité par madrileno (oui il dit pas que des conneries), tu comprendras que google ne sépare pas les mots dans une url avec underscore.
 
WRInaute accro
petit test pour cleden ->

voici mon url rewriting
RewriteRule ^tutorial-([0-9]+)-(.+).html$ /index.php?gestion=pages&id_page=$1 [L]

j appelle : turorial-27-mangeur-de-cignogne.html

resultat => aucuns problèmes, page bien affichée

le "-" dans une variable ne gene donc aps un url rewriting basé sur les "-"

CQFD :)
 
WRInaute occasionnel
squawk a dit:
Si tu regarde bien, l'url comporte des caractères en gras, c'est bien que, d'une certaine façon, google parvient à distinguer les mots séparés par des underscores.

C'est le piège classique :wink: Si tu relis l'article cité par madrileno (oui il dit pas que des conneries), tu comprendras que google ne sépare pas les mots dans une url avec underscore.

Heureusement, 1500 messages de conneries ça f'rait beaucoup ;-)
 
WRInaute impliqué
8O , faut arrêter le kiwi. C'est ce qu'on peut appeller une démonstration baclée: tout le monde d'utilise pas ta règle de réécriture. Je ne pourrai (malheureusement) jamais utiliser une règle aussi simple...

Je rappelle la question au cas où certains l'auraient oubliée :?
sur le site http://www.easyexpat.com/index_fr.htm
le webmaster a mis des tirets bas avec fr dans le titre htm.
pourquoi n'a-t-il pas choisi des tirets hauts plutôt ?

Loïc.
 
WRInaute occasionnel
Sans vouloir polemiquer, je ne suis tjrs pas d'accord avec l'interpretation du test de WRI... Je pense que Google lorsqu'il crawle les pages, repere les mots qui ont un sens et est capable de lire "patate violette" lorsqu'il y a "patate_violette" ou "patate-violette", que ce soit dans le texte ou l'url....

Pour prouver cela il faudrait faire un test avec des vrais mots et pas "sdpfgpdfgk"....

Pourquoi ?

Parce que dans l'absolu si mon hypothese est vraie le test de WRI ne permet absolument pas de l'infirmer: si Google avait la capacite de reperer des mots par rapport a leur existence dans un dictionnaire, pour lui wswsws_sfdfd serait different de wswsws sfdfd puisque le mot est de toute maniere inconnu pour lui.

Donc WRI, pourquoi ne pas faire exactement le meme test (donc pas de texte ni de BL ni de title) mais avec des mots 'existant' qui ne retournent pas trop de pages dans google, ce qui permettrait de comparer l'underscore et le tiret (meme si les pages se retrouvent toutes les deux dans les profondeurs du classement ?)

Juste une idee comme ca...
 
WRInaute accro
Tu crois vraiment que google utilise un dico avant de classer les mots et les pages ? :wink:

sdpfgpdfgk c'est un mot pour google...

Je rappelle la question au cas où certains l'auraient oubliée
Citation:

sur le site http://www.easyexpat.com/index_fr.htm
le webmaster a mis des tirets bas avec fr dans le titre htm.
pourquoi n'a-t-il pas choisi des tirets hauts plutôt ?

Pkoi ? certainement parcequ'il ne connait pas webrankinfo :wink: Bcp de site font la même chose dont Kelkoo qui est plutot pas mal dans le référencement pour le reste... maintenant vu l'importance que google apporte aux keywords de l'url a mon avis c'est pas bien grave.. :wink:

Maintenant pour les problèmes techniques liés à l'ur rewrinting, c'est peut etre possible si qquun (cleden ?) a un exemple ou l'on est obligé de mettre des _ au lieu des - je veux bien voir :wink:
 
Membre Honoré
Oui google utilise son dictionnaire exemple pour les synonymes mais il est beaucoup plus développer pour le Web Américain... :(
 
Olivier Duffez (admin)
Membre du personnel
lesbonsplansdesophie, tu opposes à ma démonstration ton opinion, que je respecte mais qui n'engage que toi. Donne-moi un contre-exemple qui prouve que Google sait distinguer deux mots séparés par un underscore !

Dans le test que tu me proposes, pourquoi me dis-tu "pas de texte ni de BL ni de title" ?

Peux-tu également préciser ce que tu entends par "Google propose des expressions connexes" ? Je ne vois pas où il fait ça (pourtant ce serait utile).

@squawk: easy expat fait partie de WRI, depuis longtemps d'ailleurs ;-)
 
WRInaute occasionnel
Je crois que je me suis mal exprime... ce que je voulais proposer, c'est que tu refasses *exactement* le meme test, mais avec des mots existant (sur une expression qui renvoit peu de resultats pour avoir une chance de retrouver tes pages)

Comme tu le dis cette opinion n'engage que moi ! Et je suis tout a fait pret a reconnaitre qu'elle est fausse (d'ailleurs en suivant tes conseils, sur mes sites j'utilise le tiret alors...)

Ce que je dis, c'est juste que ton test n'infirme pas mon hypothese : a partir de celui-ci on peut dire seulement que sur des mots inconnus, le tiret est un separateur et l'underscore n'en est pas un (ce qui en soit est deja bien je te l'accorde :) ) Mais pas que le tiret est un meilleur separateur que l'underscore *dans tous les cas*.

Es-tu d'accord avec ma conclusion ci-dessus ? Si oui, peut-etre qu'un test avec de 'vrais' mots permettrait de clore definitivement le debat....

PS: et pour les expressions connexes je me suis encore mal exprime... mais par exemple si je fais comme recherche 'traduinoo' (un de mes sites), il va me dire un truc du style
Essayez avec cette orthographe : traduit
preuve qu'il n'est pas mauvais pour extraire la racine d'une expression...
 
Olivier Duffez (admin)
Membre du personnel
lesbonsplansdesophie, qu'appelles-tu un "vrai mot" ??? pour toi, WebRankInfo est-il un vrai ou un faux ? Sérieusement, comment veux-tu que Google fonctionne s'il devait maintenir à jour un dictionnaire ?

mon test ne fait pas de différence entre les mots "vrais" ou "faux". Je veux bien te trouver un exemple qui infirmera ton hypothèse mais il faudrait me dire ta définition de "vrai mot".

concernant les expressions "connexes", il s'agit uniquement des mots proches, qui ont été plus souvent tapés par les internautes.
 
WRInaute occasionnel
WebRankInfo a dit:
concernant les expressions "connexes", il s'agit uniquement des mots proches, qui ont été plus souvent tapés par les internautes.

En as tu la preuve ? A ce moment la dans le cas de mon exemple qu'est ce qui lui permet de me proposer 'Traduit' et pas n'importe quel autre mot tappé par les internautes ?? Et en supposant que c'est vrai pkoi google ne chercherait-il pas a reperer ces fameux mots dans les pages qu'il crawle ?

Pour moi un vrai mot est un mot du dictionnaire, tout simplement. Et construire une base de donnees la dessus ne me parait pas irrealisable, apres tout c'est une table avec une entree par ligne...

Pour moi Webrankinfo n'est pas un mot, et dans ce cas ne sera pas detecte dans Webrankinfo_balbalslalsl et le sera dans Webrankinfo-ssfsdfsdfsdf

En revanche ton test ne prouve pas que voiture ne sera pas detecte dans voiture_sdfsdfsf , c'est tout ce que je dis.

Maintenant je ne comprends pas toute cette virulence autour de ce topic, apres tout je m'en fiche moi ! Mais la conclusion de ton test n'est pas exactement celle que tu laisses entendre, et ca tu ne peux pas dire le contraire, si ?
 
WRInaute accro
En as tu la preuve ? A ce moment la dans le cas de mon exemple qu'est ce qui lui permet de me proposer 'Traduit' et pas n'importe quel autre mot tappé par les internautes ?? Et en supposant que c'est vrai pkoi google ne chercherait-il pas a reperer ces fameux mots dans les pages qu'il crawle ?

Recherche le fameux topic, "jaime ma boite" :D
 
WRInaute occasionnel
Autre exemple, la recherche chient_chat propose de corriger par "chien_chat" (preuve que au moins dans les recherches google separe les mots) tandis que n'importe qu'elle autre expression (genre "chient;chat", "chient*chat", "chient/chat") ne se verra pas proposer de correction orthographique....

Maintenant effectivement ca ne prouve rien pour ce qui est des urls, mais si google separe les mots dans la recherche pkoi ne le ferait-il pas lors du crawl ?
 
WRInaute accro
Oui et donc ?

Pourquoi google propose... ce qu'il propose et pas 'j'aime ma botte' par exemple ?

Parcequ'il n'y a pas de site j'aime ma botte mais qu'il y a un site "j'aimela***" qui était le plus proche de la requete, preuve qu'il n'a pas utilisé de dico ou la moindre intelligence pour comprendre le sens de la requete, il ne fait que comparer des lettres. :wink:
 
Olivier Duffez (admin)
Membre du personnel
donc Google gèrerait différemment les mots présents dans son dictionnaire et les autres mots ? Ca me semble capillo-tracté ;-)

je crois que je vais faire d'autres tests pour éviter trop de virulence... mais parfois l'évidence ne saute pas aux yeux des autres et forcément ça énerve un peu. Excuse-moi donc si j'ai été virulent.

au sujet de la conclusion de mon test, la voici : Google ne considère pas l'underscore comme un séparateur de mots, que ce mot soit dans un dictionnaire ou non ne changeant rien (mais ce dernier point je sens qu'il va falloir que je te le prouve...).
 
WRInaute impliqué
Dans aucune langue on utilise un underscore pour composer un mot à partir de deux autres. Google n'a absolument aucune raison de prendre cela en compte que ce soit dans l'URL ou ailleurs.

Les développeurs d'applications devraient aller dans mon sens, en effet, lorsqu'on a des quantité de données faramineuses à brasser et pire encore dans le cas de Google, on en s'amuse pas à ajouter des règles couteuses en terme de ressources matériel et d'espace disque comme "Inventer de nouveaux mots"

Maintenant je ne m'avancerai sur aucune hypothèse pour la prise en compte séparée des mots autour de l'underscore car je n'ai fait aucun tests moi même ... En tout cas une chose est sûre x_y n'est pas un mot à part entière pour Google
 
WRInaute accro
lesbonsplansdesophie a dit:
Autre exemple, la recherche chient_chat propose de corriger par "chien_chat" (preuve que au moins dans les recherches google separe les mots) tandis que n'importe qu'elle autre expression (genre "chient;chat", "chient*chat", "chient/chat") ne se verra pas proposer de correction orthographique....

ah ouais.. pas mal ça :)
 
Membre Honoré
Dans l'exemple on remarque que sur le résultat de chien_chat seules les pages avec chien_chat et non pas chien (et) chat ressortent :)
Donc on aura apris 2 choses sur ce topic ( pour ceux qui ont rien vu encore :lol: )
 
WRInaute accro
Dans l'exemple on remarque que sur le résultat de chien_chat seules les pages avec chien_chat et non pas chien (et) chat ressortent
Donc on aura apris 2 choses sur ce topic ( pour ceux qui ont rien vu encore )

ce qui prouve bien qu'il ne sépare pas les 2 mots...
 
WRInaute impliqué
Je m'incline :

Pour cette requête : https://www.google.fr/search?hl=fr&c2cof ... t+&spell=1

On remarque que dans le premier résultat on peut voir : ... chien_chat, Gửi vào: Jun 6 2004, 06:44 PM. Quote Post. Nhập môn ... chien_chat,
Gửi vào: Jun 6 2004, 06:45 PM. Quote Post. Nhập môn ...

Je cherche donc : https://www.google.fr/search?q=site:gevf ... 1&filter=0

-> Aucun résultat comportant chien_chat n'est trouvé

Je cherche alors : https://www.google.fr/search?hl=fr&c2cof ... cher&meta=

-> Il trouve bien chien_chat

Olivier avait raison, autant pour moi.
 
WRInaute occasionnel
Toujours dans l'exemple on remarque que les deux premiers résultats sur "chien_chat" ne ressorte pas du tout sur la requete "chien chat site:lesiteenquestion". CQFD ?

ajouté : rituel un poil plus rapide que moi :)
 
WRInaute discret
ouh la la , que de reponses :D

merci les gars,
j'ai compris en fin de compte qu'il vaut mieux utiliser le tiret simple dans les titres de mes pages que le tiret bas. c'est meilleur pour le referencement.

de plus, je me pose une autre question. il vaut mieux des titres de pages avec un seul mot clé ou non ?.
je crois que mettre plusieurs mots separés par un tiret dans un titre de page est compliqué pour le referencement.... qu"en pensez-vous ?
 
WRInaute occasionnel
Si c'est du titre de ta page dont tu parles, mets simplement tes mots cles separes par des espaces et ca devrait aller :)
En revanche attention a ne pas faire de titre a rallonge, et si possible utilise un langage naturel plutot qu'une litanie de mots cles (mais je ne sais pas si l'interet de faire une phrase +tot qu'un suite de mots cles a ete prouve...)
 
WRInaute accro
laure19 a dit:
ouh la la , que de reponses :D

merci les gars,
j'ai compris en fin de compte qu'il vaut mieux utiliser le tiret simple dans les titres de mes pages que le tiret bas. c'est meilleur pour le referencement.

de plus, je me pose une autre question. il vaut mieux des titres de pages avec un seul mot clé ou non ?.
je crois que mettre plusieurs mots separés par un tiret dans un titre de page est compliqué pour le referencement.... qu"en pensez-vous ?

si tu parles bien des noms des pages , tu peux mettre plusieurs mots clés (sans trop abuser) exemple : tutorial-manger-des-pommes.html ca ne pose aucun problème au referencement . le mieux qd meme est d essayer de se positionner sur une association de 2 mots clés

c est pas que le tiret haut soit meilleur que le tiret bas, c est qu'il y en a un qui fait la distinction des mots, l autre va ne voir qu'un seul mot. c est sans commune mesure :)
 
WRInaute occasionnel
e-kiwi a dit:
c est pas que le tiret haut soit meilleur que le tiret bas, c est qu'il y en a un qui fait la distinction des mots, l autre va ne voir qu'un seul mot. c est sans commune mesure :)

Il faudrait rajouter que ceci n'est vrai que pour google.

yahoo trouve bien par exemple la page -https://www.webrankinfo.com/mazidipole_vukertalet-wagatukepo-sitynozfau.php avec la requête "vorismetapalu terplamili".

idem pour la beta de msn (la non beta ne la trouve pas).
 
Olivier Duffez (admin)
Membre du personnel
jerome347 je pense qu'on ne peut plus utiliser mes pages de test pour faire des tests avec Yahoo ou MSN car des gens ont fait des liens vers ces pages de test, éventuellement avec les mots que tu as cités comme textes de liens, ce qui fausse tous les résultats.

mais c'est vrai que je ne l'ai testé que pour Google, tu as raison.
 
WRInaute accro
de plus, je me pose une autre question. il vaut mieux des titres de pages avec un seul mot clé ou non ?.
je crois que mettre plusieurs mots separés par un tiret dans un titre de page est compliqué pour le referencement.... qu"en pensez-vous ?

Vaut mieux en mettre une dizaine, les plus importants au début voir répeter 2 fois (mais pas plus) sauf si tu veux absolument ressortir sur une seule requete (genre oupouapout :roll: ) tu peux mettre 1 seul mot clé quoique c'est pas prouvé que ça a plus d'impact...
 
WRInaute occasionnel
WebRankInfo a dit:
jerome347 je pense qu'on ne peut plus utiliser mes pages de test pour faire des tests avec Yahoo ou MSN car des gens ont fait des liens vers ces pages de test, éventuellement avec les mots que tu as cités comme textes de liens, ce qui fausse tous les résultats.

effectivement
me reste plus qu'à trouver d'autres exemples ;-)

edit: ceci dit, google ne trouve toujours pas cette page avec la requête sans l'underscore.
 
WRInaute accro
squawky ->

>> voir répeter 2 fois (mais pas plus)

ca craitn aps de les repeter ? tu parle des titres des pages ou des noms dans la barre d adresse ?
 
Discussions similaires
Haut