Réecriture url non latin. Quelle est la meilleur methode ?

WRInaute discret
Bonjour,

Suite à pas mal de réflexion je vous propose une étude de cas sur les réecriture d'url dans des langues qui ont alphabet non latin. Comme le grecque chinois russe etc...

Voici mon site avec les exemples d'utilisation : http://free-games-greek.wullix.com/ et http://free-games-russian.wullix.com/

J'ai vue que certain site intègre directement les liens dans la langue avec l'alphabet de la langue
ex : https://www.google.gr/search?hl=el&q=παιχνιδια+για+κοριτσια&meta=&aq=1&oq=Παιχνίδια
Le premier résultat est asser explicite. Puisque la personne intégré directement le cyrilique dans l'alphabet

Après il existe une 2 eme méthode que j'ai utilisé qui est de convertir les caractère cyrilique en alphabet latin pour le même mot:
Ex : https://www.google.fr/search?hl=fr&q=site:free-games-greek.wullix.com&btnG=Rechercher&meta=

Ou une 3 eme qui consiste a utilisé du url_encode pour toutes ces urls. J'ai testé et les résultat était peu concluant. Puisque cela donne des urls très longue et non lisible dans les moteurs de recherche.

Qu'elle serait vos recommendation?

J'ai essayé de chercher un topic sur le sujet mais malheureusement je n'en ai pas trouvé de suffisamment explicite.

Qu'elle sont vos avis et experience sur le sujet?

Je pense que c'est un sujet qui peut se montrer très pertinent puisque avec le temps les sites évolue de plus en plus vers le multilingue. Et la toile s'ouvre de plus en plus vers d'autre communeauté ;)
 
WRInaute occasionnel
A mon avis juste pour l'url il vaut mieux convertir en caractères latin comme ds la deuxième solution. C'est quand même bien plus propre. Après c'est sur qui faut quand même se placer du point de vue visiteurs... Sur leur clavier etc c'est peut être plus simple de taper une url avec leurs vrais caractères, faudrait voir comment ça se présente chez eux.
Et puis aussi décortiquer tes stats et voir si c'est les mots clés avec l'alphabet originel ou transposé qui t'amènent le plus de monde. Bref, c'est clair que c'est un vaste débat.
Et puis tant qu'à faire tu pourrais faire les deux... :)
 
WRInaute discret
Salut antinomx,

Merci beaucoup pour ta réponse.

En fait coté vue les 2 méthode sont propre a condition de ne pas faire d'url encode sinon ca donne des urls avec pleins de % et des chiffres.

Après pour la 2 eme méthode elle est viable en grecque par exemple parce que un lettre grecque est égale a une lettre en latin mais d'autre langue ce n'est pas tout a fait possible. Puisque en chinois un lettre chiinoise fait plusieur lettre en latin pour écrire une sorte de phonétique je suppose.

Moi perso coté utilisateur je pense qu'il est plus agréable de faire une réecriture d'url avec les caractère de la langue concerné.
Je pense qu'entre 2 résultat affiché par un moteur de recherche les utilisateurs auront plus tendance a cliqué sur une url UserFriedly qu'une tentative de translation de caractère surtout pour les langue asiatique ou les correspondances sont pas terrible. Mais cela ne reste qu'un avis perso bien entendu.

Mais coté référencement qu'est ce qui est le mieux c'est la grande question que je me pose.

Malheureusement je ne suis pas parvenu a trouver des posts ou des topics sur le sujet. Pourtant je pensais que ce type de sujet était relativement important pour l'avenir. Et que pour être au top du référencement c'est un sujet a traiter. Puisque un référencement doit etre optimum dans n'importe qu'elle langue avec n'importe qu'elle typo pour faire ses preuves.

Dur dur le réferencement par moment ;)
 
WRInaute occasionnel
Alors d'un point de vue purement technique, pour le référencement à partir du moment ou ya aucun défaut d'encodage et que tous tes caractères sont correctements affichés ça ne devrait pas te porter (enfin je pense) préjudice.
Faudrait aussi tester avec un outil "spider view" histoire de bien vérifier que tout roule.
 
WRInaute discret
Bonjour,

Voilà j'ai mis en place les réecriture d'url en caractere non latine.

J'ai appliqué cette méthode pour le moment sur le site de jeux en chinois que j'ai fait http://free-games-chinese.wullix.com


Et voici la liste des urls indexé :
https://www.google.fr/search?hl=fr&q=site:free-games-chinese.wullix.com&meta=&aq=f&oq=


Et je constate que google prend bien en compte et surligne les mot chinois dans les urls voici un exemple :

https://www.google.cn/search?hl=zh-...wullix.com+联系我们&btnG=Google+搜索&meta=&aq=f&oq=

Je pense qu'avec tous les outils mis à notre disposition aujourd'hui que cette façon de construire ces url devrais rapidement porté ces fruits. Mais ca reste a confirmé par la communieauté chinoise parce que malheureusement on ne la connais pas suffisement les heures habitude lorsqu'il font une recherche. Tape t'il en chinois ou caractère latine. Ca peut etre un bon sondage a faire?

Qu'en pensez vous de tous ça?
 
Nouveau WRInaute
Hello Mitus,
je suis face au même problème et je suis partagé entre mettre une partie de l'url en caractère non-latin ou anglissiser mon url.

Peux-tu apporter un retour d'expérience après qq mois d'utilisation de ton système?

Merci!
 
WRInaute discret
Bonjour ponsfrilus,

Désolé pour la réponse tardive. Pour ces histoires d'url j'ai lancé l'indexation avec une partie en caractère latine et une partie dans les caractères d'origine. De ce que j'ai put voir dans quelque recherche google. C'est qu'il tend à effectuer des recherches utf8 ce qui implique qu'il prendrait en compte les mot écrits en caractère non latine.

Bien entendu je ne peux pas le certifié a 100% puisque les secrets google sont bien gardé ;)

Par contre en voici un exemple ce ont je parle
https://www.google.com/search?clien...es-chinese.wullix.com+政治游戏&btnG=Google+Search

Et tu constats que les mots clés 政治游戏 sont bien mis en gras dans l'url comme si il en prend en compte. ou encore
https://www.google.com/search?hl=en...:fr:official&hs=JqQ&q=政治游戏+wullix&btnG=Search

Mais malheureusement avec les problèmes de censure en chine je ne peux pas encore affirmé si cela apporte un meilleur référencement. Mais la ou on peut être gagnant c'est le coté esthétique pour les visiteurs qui font une recherche. Je pense qu'il apprécie plus de lire une url dans les bon caractère qu'un transtipage qui peut être hasardeux.

J'ai appliqué ces 2 méthode sur ces 2 sites

http://free-games-greek.wullix.com
http://free-games-russian.wullix.com

Ces 2 sites travaillent avec les 2 type d'urls en meme temps.

En résumé coté reférencement c'est encore flou. Mais coté utilisateur je prefere des urls dans les bon caractere dans la langue du visiteurs. Après il ne faut pas oublié que les sites en premier lieux sont fait pour des utilisateurs c'est pour ça je prefere la solution caractère dans la bonne langue.

Qu'en penses tu de tout ça?

Merci
 
Nouveau WRInaute
Salut Mitus,
tu as des résultats à nous fournir depuis ta phase de test, car le sujet m'interesse beaucoup ! :D
URL en caractères latins or not ?
 
Discussions similaires
Haut