Encodage UTF-8 est pages multi-langue

J
jm
Guest
Bonjour a tous...
Pour le referencement au cas ou un site est multy langue

Q:No1Est-il mieux d'utiliser la balise suivante:
A<meta http-equiv="Content-Type" content="text/html; charset=utf-8">

dans le cas ou cette balise soit utiliser

Q:No2 Est-ce que google comprends le language du site
Q:No3 Est-ce que..
B<meta http-equiv="Content-Language" CONTENT="JP">
est inevitable?

Dans le meme repertoire...
Si j'ai un fichier html qui a deux langues differentes... Englais et Japonais

Q:No4 Est ce que je peux faire passer le message a google juste avec A
Q:No5 Ou dois-je ajouter B modifier de la facon suivante:
<meta http-equiv="Content-Language" CONTENT="JP-EN">

Q:No6 Savez-vous si
modifier de la facon suivante:
<meta http-equiv="Content-Language" CONTENT="JP-EN">
est completement deconseille?

:roll: Merci beacoup 8O

JM :roll:
 
WRInaute discret
inquiètes toi pas si t'as pas de réponses
ici c'est pas un forum pour les nouveaux
c'est un forum pour les anciens
une sorte de club fermé en sorte
une secte où les membres se congratulent entre eux de la dernière bidouille qu'ils ont trouvé

ils parlent dans un langage abscons et pétris d'acronymes de tous poils
destiné à décourager toutes tentatives de lecture

Il y en a beaucoup (trop) de forums comme celui-ci

Sortons sans faire de bruit et fermons doucement la porte pour ne pas les déranger.
 
WRInaute discret
Tu devrais essayer de chercher qq sites en japonais et anglais (genre auto, hi-fi ...) bien référencés dans leur domaine et faire comme eux ...
 
J
jm
Guest
Moffen a dit:
Tu devrais essayer de chercher qq sites en japonais et anglais (genre auto, hi-fi ...) bien référencés dans leur domaine et faire comme eux ...

j'y ais pense mais...que du "JIS" pour le moment....
Le "JIS" fonctione mais le "UTF-8" est bien plus pratique surtout pour la exportation de base de donnees d'un site multy langues .....

Merci en tout cas ....

Je devrais peut etre reformuler ma question:
dans le cas ou on utilise cette balise:
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">

celle-ci est-elle obligatoire? ou le moteur reconait-il le language?
<meta http-equiv="Content-Language" CONTENT="JP">

Je dirais merci plus tard :wink:
S'iiiiiiiilllllllllllll vooooouuuuuuus plllllaaaaaaiiiiiiiiittttttt..... :lol:

JM.
 
WRInaute passionné
Bonjour jm,

bienvenue sur WRI :)

Pas si simple, ta question. Ce sujet a déjà suscité bien des débats contradictoires entre spécialistes :(

La référence : ce qu'en dit le W36C
Les encodages de caractères couramment utilisés sur le Web comprennent ISO-8859-1 (appelé aussi « Latin-1 », utilisable pour la plupart des langues d'Europe de l'Ouest), ISO-8859-5 (qui gère le cyrillique), SHIFT_JIS (un encodage du japonais), EUC-JP (un autre encodage du japonais) et UTF-8 (un encodage de ISO 10646 qui utilise un nombre différent d'octets pour différents caractères). Les noms des jeux de caractères sont insensibles à la casse, de sorte que, par exemple, "SHIFT_JIS", "Shift_JIS", et "shift_jis" sont équivalents.

Pour les sites multilingues, je ne retrouve plus mes références :oops:
mais je continue mes recherches.

Amicalement,
Monique
 
WRInaute impliqué
Jm, tes questions n'ont pas de réponses franches, car personne n'est vraiment sûr de l'utilisation du Meta language par les moteurs.

Par contre, pour une page en plusieurs langues, je mettrais: "jp,en"
La forme avec traits d'union étant réservée aux variantes (par ex. en-US = anglais des Etats-Unis)

A propos, qqun sait-il où on peut trouver une liste de ces langages ?
Je cherche actuellement "hollandais" (du, nd ?) et italien (it sans doute).
 
J
jm
Guest
Remi L. a dit:
Jm, tes questions n'ont pas de réponses franches, car personne n'est vraiment sûr de l'utilisation du Meta language par les moteurs.

Par contre, pour une page en plusieurs langues, je mettrais: "jp,en"
La forme avec traits d'union étant réservée aux variantes (par ex. en-US = anglais des Etats-Unis)

A propos, qqun sait-il où on peut trouver une liste de ces langages ?
Je cherche actuellement "hollandais" (du, nd ?) et italien (it sans doute).


Voila une reponce... Merci... beacoup...

c'est toujours mieux que d'attendre...

Bon d'apres mes recherche, j'ai l'impression que le meta language n'est pas necessaire, definire l'encoding en utf-8 est suffisant...

mais je n'en suis pas completement sur pour le moment!
 
WRInaute impliqué
C'est à peu près sûr que ce n'est pas nécessaire en soi... Mais, cela ne coûte pas beaucoup de le mettre. Il suffit de mettre la langue principale de la page.
Et si cela sert dans certains cas assez rares, eh bien, tant mieux. 8)

Par contre, UTF-8 est un jeu de caractère. Il est nécessaire de mentionner le jeu de carcatères utilisé pour que le navigateur du visiteur sache interpréter correctement nos textes.
Ici, en Europe, nous évitons généralement l'UTF-8 car il pose des problèmes sur certains navigateurs. Par contre, au Japon c'est complètement différent... :wink:
 
WRInaute impliqué
Théoriquement aucun... ;)
En pratique, il y a un paquet de navigateurs qui ne sont pas configurés en reconnaissance automatique... (D'ailleurs en écrivant cela, j'ai vérifié le mien et j'étais en mode 8859-1 "forcé".)
 
WRInaute occasionnel
Je pense que la plupart de ceux qui utilisent IE (donc 95% ;-) ) sont en ISO.
Le probleme avec le UTF est que les caracteres traites en é par exemple, apparaitront avec des caracteres chinois (ou japonais, je ne suis pas tres bon en langues asiatiques... :lol: ).

Bref, tout depend de la cible. Si elle est majoritairement occidentale, je conseille une forme Western European ISO-8859-1 (aussi appele Latin-1).

En ce qui concerne la balise meta language, je ne suis pas vraimment sur de son utilite... c'est plutot le contenu de ta page qui fera un bon referencement.
 
J
jm
Guest
je commence a comprendre...

donc s'il n'y a que de l'englais et du japonais l'utf-8 ca devrais pas poser de probleme...
Mais si j'ai du Francais ou une langue avec carachtere speciaux ... risque d'y avoir des problemes!?

Ce qui ce passe c'est que l'encodage de la base de donnee depends aujourd'hui de la langue choisit par l'utilisateur ! donc ceratains utilisateur encode en "Shift_JIS" pour le japonais et d'autres en "iso-8859-1" pour l'englais ...

Si je veux exporter ma base de donnee avec phpmyadmin je dois choisir un encodage et j'ai toujours un probleme vu qu'il y a deux encodages differents... c'est pour ca que je penser tout convertir en utf-8, afin de permetre un changement de hosting service...

quelqu'un aurait-il une solution?
Merci,

JM.
 
WRInaute passionné
Je crois que tu devrais rester sur ton idée de choisir l'UTF-8, c'est justement fait pour gérer la coexistence dans un même document de caractères relevant autrement de jeux différents. Personnellement je n'ai pas de problèmes pour afficher les pages en UTF-8 que ce soit avec IE (5.5 et 6) ou Mozilla Firefox, dès lors que le jeu est correctement déclaré par <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> . Je n'ai jamais touché à un paramètre quelconque concernant le jeu de caractères. Le problème évoqué par Cyril ne se manifeste que si ton code contient nativement des caractères accentués du genre é ou à ou ê. S'ils sont codés avec des entités HTML (&eacute; ou &agrave; ou &ecirc; pour reprendre les mêmes exemples), il n'y a pas de problème. Mais ce n'est que mon humble avis...

J'ai trouvé que http://perso.wanadoo.fr/coin.des.expert ... q5_4b.html était une lecture utile.
[ajouté: aussi http://selfhtml.selfhtml.com.fr/interna ... nicode.htm , merci David@site à qui j'ai piqué la référence ;) ]
 
Discussions similaires
Haut