Caractères étrangers (Chinois, Japonnais, Russe) dans l'URL

WRInaute discret
Bonjour,

J'utilise l'URL rewriting pour optimiser le référencement de mes pages.

Dans certaines URL j'utilise des caractères étrangers (Chinois, Japonnais, Russe).

Ceci peut-il poser problème en terme de référencement ? Google suit-il bien ces liens ? Les navigateurs acceptent-ils ce genre de liens ?

Merci
 
WRInaute accro
Déjà abordé plusieurs fois récemment, mais je n'arrive pas à mettre la main sur le sujet.

Une URL ne doit contenir que des caractères ASCII 7 bits (et encore, pas tous). Pour les autres, il faut qu'ils soient encodés en %xx. Reste le problème de savoir quel est le charset utilisé (iso, utf-8, toujours le même, le même que celui de la page...). L'idéal c'est d'utiliser de l'UTF-8 et que la page elle-même soit en UTF-8.

Dans ces conditions, Google reconnaît ça (aucune idée pour les autres), et les navigateurs récents aussi (i.e. ils vont afficher la version "décodée", pas la version avec des % partout). Meilleur exemple, Wikipedia.

Maintenant l'inconvénient, c'est que si tu postes (dans un forum, sur FB, twitter, etc.) une URL dans le texte d'un message, tu cours le risque que l'algo qui détecte automatiquement les URLS et les transforme en liens se vautre et n'aille pas jusqu'au bout de l'URL. Dans ce cas tu te retrouves avec des liens cassés. Et même si le lien complet est pris, ces algos ne vont pas forcément "décoder" tout ça, donc tu y perds en termes d'ancres qui utilisent tes mots-clefs.

Jacques.
 
Discussions similaires
Haut