UTF-8, d'accord mais...

Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics

skyuma
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 23
Inscription: 7 Mar 2004

UTF-8, d'accord mais...

Message le Dim Jan 30, 2005 3:32

Je fais des sites dans différentes langues et j'ai un problème avec l'utf-8, je ne sais pas comment convertir mes textes, arabes, japonais ou memes francais, en utf-8.
En effet comment savoir que " Çهنه " s'écrit " Çهنه "en utf-8.
Si quelqu'un pouvait m'aider :)

trix
WRInaute discret
WRInaute discret
 
Messages: 97
Inscription: 23 Mar 2004

Message le Dim Jan 30, 2005 8:25

Tu dis pas quel language tu utilises, mais si tu fais du PHP t'as l'embaras du choix. Regarde du cote de 'mbstring','iconv' et 'recode' (dans l'ordre de ma preference perso).

iconv et recode sont aussi des utilitaires qui se retrouvent en ligne de commande sur la majorite des Unix (de nouveau dans l'ordre de preference perso).

Si t'es sous windows, je peux pas t'aider, mais je suis sur qu'une ame charitable va completer mes infos.

French Fred
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 265
Inscription: 12 Fév 2004

Message le Dim Jan 30, 2005 11:41

Salut,

Le format de codage utf8 permet d'utiliser un texte d'un codage different du support entre autre (si mes souvenirs sont correctes).

En creant une page sous dreamweaver, j'ai modifie le charset de la page en utf-8.

Ensuite, j'ai copie le texte " Çهنه " dans les sources de la page.

Puis un copier-coller en mode Design

Le resultat est dispo a cette adresse:
http://le-regent.net/test/encodage.html

Tu noteras que la lecture des sources sous IE et sous FF sont differents.
IE utilise le bon encodage mais il y a des pertes de donnees
FF utilise le bon encodage sans perte de donnees

Il est tout a fait possible d'ecrire du chinois, japonais, arabe, turc, ... dans les sources de tes pages web sans rencontrer de probleme.


Cordialement,

FRed

skyuma
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 23
Inscription: 7 Mar 2004

Message le Dim Jan 30, 2005 14:58

trix a écrit:Si t'es sous windows, je peux pas t'aider, mais je suis sur qu'une ame charitable va completer mes infos.

Mes serveur de prod son sous linux, mais je dev sous windows.
J'ai essayer d'utiliser une version d'iconv pour mais bon j'ai pas reussi a le faire marcher.

Pour French Fred
j'utilisai phpedit pour mon code, apparement il ne gère pas l'utf-8, et effectivement avec dreamweaver ca a l'air de marché :D

Merci a tout les deux.

Didier_S
WRInaute impliqué
WRInaute impliqué
 
Messages: 567
Inscription: 24 Aoû 2004

Message le Dim Jan 30, 2005 23:57

utf8_encode code la chaîne data au format UTF-8 , et retourne la version codée. UTF-8 est un mécanisme standardisé utilisé par Unicode pour coder les caractère de grande taille dans des flux d'octets. UTF-8 est transparent pour les caractères ASCII , il est auto-synchronisé (c'est à dire qu'un programme peut toujours savoir dans un flux d'octet où un caractère commence), et peut être utilisé pour faire des comparaisons de chaînes standard, comme pour le tri.


ceci étant valable pour PHP >= 3.0.6 et supérieurs
okay?!

skyuma
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 23
Inscription: 7 Mar 2004

Message le Mar Fév 01, 2005 9:59

Bizarre, bizarre, ya une semaine j'ai lu que cette fonction ne marchait que sous linux parce qu'elle utilise iconv justement, et là je ne vois rien justement dans la doc. Je l'essaye et ca marche effectivement sous windows :D
Cool.


BadProcESs
WRInaute accro
WRInaute accro
 
Messages: 2657
Inscription: 28 Juil 2003

Message le Mar Fév 01, 2005 10:06

Heu... Et utf8_encode() tout simplement ne convidendrait-il pas ?

skyuma
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 23
Inscription: 7 Mar 2004

Message le Mar Fév 01, 2005 11:49

BadProcESs a écrit:Heu... Et utf8_encode() tout simplement ne convidendrait-il pas ?

oui c'est ce que Didier_S a dit :wink:

Tchinkatchuk
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 291
Inscription: 22 Avr 2003

Message le Jeu Avr 14, 2005 9:46

de mon coté, iconv marche tres bien de la facon suivante :

Code: Tout sélectionner
   $chaine = iconv('UTF-8', 'ASCII//TRANSLIT',$chaine);


maxttb
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 477
Inscription: 27 Fév 2004

Message le Mer Avr 27, 2005 11:55

Mais est-ce que les conversions par utf8_encode sont vraiment necessaires?
Dans le cadre d'un site multilingue, où il est plus que recommandé d'écrire toutes les expressions, phrases dans des fichiers séparés (textes ou xml), la conversion à t-elle vraiment un sens?
Pour mes sites, je fais des fichiers textes enregistrés en utf-8 et mes scripts se chargent de lire ces fichiers et les réécrire tel-quels au navigateur, aucun besoin de convertir quoi que ce soit.

Code: Tout sélectionner
[menu]
menu=メインメニュー
home=ホーム
tabs=タブ譜
submit=タブ譜を推薦
links=リンク集

[languages]
languages=Languages
en=English
ja=日本語
fr=Français
es=Español

etc etc


C'est, à mon humble avis, la meilleure solution car elle est très modulable (l'ajout d'une langue n'est en fait qu'un ajout de fichier) et évite tous les problèmes de conversion d'encodage...


Monique
WRInaute passionné
WRInaute passionné
 
Messages: 1545
Inscription: 16 Sep 2002

Message le Mer Avr 27, 2005 12:55

Bonjour,

L'utilisation des jeux de caractères et références d'entité est loin d'être simple.
Quelques liens utiles :
- Introduction aux jeux de caractères
- L'encodage des caractères, fiches de la présentation de Normand Lamoureux et fichier audio (W3CQuébec)
- Caractères spéciaux et encodage
- UTF-8 sous SciTE, configuration

Pour éviter bien des déconvenues, il ne faut jamais oublier que
Normand Lamoureux a écrit: * que l'encodage se produit au moment d'enregistrer le fichier
* que pour être correcte, la déclaration d'encodage doit correspondre à celle qui fut réellement utilisée
* qu'il ne suffit pas de changer la déclaration d'encodage pour qu'un changement d'encodage se produise
* que les éditeurs de texte ne sont pas également fiables en matière d'encodage et de changement d'encodage


Amicalement,
Monique

skyuma
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 23
Inscription: 7 Mar 2004

Message le Lun Mai 02, 2005 10:34

maxttb a écrit:Mais est-ce que les conversions par utf8_encode sont vraiment necessaires?
Dans le cadre d'un site multilingue, où il est plus que recommandé d'écrire toutes les expressions, phrases dans des fichiers séparés (textes ou xml), la conversion à t-elle vraiment un sens?


utf8_encode c'est pour les textes qui viennent de la base de donnée et qui chez ne sont pas stockés en utf-8 mais en je sais pas quoi.
Sinon c'est clair que l''utilisation de fichier est très pratique, je peut gérer le même site dans plusieurs langues donc l'arabe le chinois et le japonais la dessus www.1001celebrity.com

bonbouaz
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 11
Inscription: 4 Jan 2003

Message le Ven Mai 27, 2005 2:26

je vais peut etre dire une anerie, mais pour moi, le plus simple, c'est d" :

1 aller sur yahoo.co.jp pour verifier que tu supportes le charset et le telecharger, le cas echeant
2 aller sur word, copier coller le texte que tu veux
3 enregistrer sous html
4 fermer, réouvrir sur dreamweaver, nettoyer le code
5 vérifier le code, et la, découvrir "oh merveille !" que tout le code est passé en 〹 et consort, ce qui te permet de rester en caractere unicode.

6 le meilleur, c'est que si tu fais un site autoadministrable, tu peux utiliser le richedit (en javascript) pour faire tes conversions a la volée.... top non ?

un bout d'exemple de résultat : http://www.tahiti-tourisme.pf/articles. ... 3&etabid=8


chantra
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 257
Inscription: 27 Juin 2005

Message le Ven Juil 01, 2005 12:26

c'est vrai que c un peu perturbant ces histoire de UTF-8. J'ai fais quelques tentaives dernierement, ou j'ouvrais un flux en UTF-8 (donc deja encodé), mais header html indique que la page etait en utf-8... mais malgre cela, le resultat affiche etait illisible.

Je n'ai pas trouve enormement de tuto expliquant comment dealer avec le monde des formats de caracteres divers et varie :? ....

Je m'y remettrait un de ces quatre, pour l'instant j'en resterait au carateres + ou - romains :)

Tchinkatchuk
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 291
Inscription: 22 Avr 2003

Message le Ven Juil 01, 2005 15:59

je devais faire un tutoriel la dessus dur developpez .xxx mais je n'ai aps le temps.

C'est galere a mettre mais quend tout fonctionne, yeepeee !!!

Bon courage en totu cas.

UTF-8, d'accord mais...

Si vous avez aimé cette discussion, partagez-la sur vos réseaux sociaux préférés :

Formation recommandée sur ce thème :

Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités


cron