UTF-8, d'accord mais...
37 messages • Page 1 sur 3 • 1, 2, 3
Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics
UTF-8, d'accord mais...
Je fais des sites dans différentes langues et j'ai un problème avec l'utf-8, je ne sais pas comment convertir mes textes, arabes, japonais ou memes francais, en utf-8.
En effet comment savoir que " Çهنه " s'écrit " Çهنه "en utf-8.
Si quelqu'un pouvait m'aider
En effet comment savoir que " Çهنه " s'écrit " Çهنه "en utf-8.
Si quelqu'un pouvait m'aider
Tu dis pas quel language tu utilises, mais si tu fais du PHP t'as l'embaras du choix. Regarde du cote de 'mbstring','iconv' et 'recode' (dans l'ordre de ma preference perso).
iconv et recode sont aussi des utilitaires qui se retrouvent en ligne de commande sur la majorite des Unix (de nouveau dans l'ordre de preference perso).
Si t'es sous windows, je peux pas t'aider, mais je suis sur qu'une ame charitable va completer mes infos.
iconv et recode sont aussi des utilitaires qui se retrouvent en ligne de commande sur la majorite des Unix (de nouveau dans l'ordre de preference perso).
Si t'es sous windows, je peux pas t'aider, mais je suis sur qu'une ame charitable va completer mes infos.
- French Fred
- WRInaute impliqué

- Messages: 265
- Inscription: Jeu Fév 12, 2004 18:19
Salut,
Le format de codage utf8 permet d'utiliser un texte d'un codage different du support entre autre (si mes souvenirs sont correctes).
En creant une page sous dreamweaver, j'ai modifie le charset de la page en utf-8.
Ensuite, j'ai copie le texte " Çهنه " dans les sources de la page.
Puis un copier-coller en mode Design
Le resultat est dispo a cette adresse:
http://le-regent.net/test/encodage.html
Tu noteras que la lecture des sources sous IE et sous FF sont differents.
IE utilise le bon encodage mais il y a des pertes de donnees
FF utilise le bon encodage sans perte de donnees
Il est tout a fait possible d'ecrire du chinois, japonais, arabe, turc, ... dans les sources de tes pages web sans rencontrer de probleme.
Cordialement,
FRed
Le format de codage utf8 permet d'utiliser un texte d'un codage different du support entre autre (si mes souvenirs sont correctes).
En creant une page sous dreamweaver, j'ai modifie le charset de la page en utf-8.
Ensuite, j'ai copie le texte " Çهنه " dans les sources de la page.
Puis un copier-coller en mode Design
Le resultat est dispo a cette adresse:
http://le-regent.net/test/encodage.html
Tu noteras que la lecture des sources sous IE et sous FF sont differents.
IE utilise le bon encodage mais il y a des pertes de donnees
FF utilise le bon encodage sans perte de donnees
Il est tout a fait possible d'ecrire du chinois, japonais, arabe, turc, ... dans les sources de tes pages web sans rencontrer de probleme.
Cordialement,
FRed
trix a écrit:Si t'es sous windows, je peux pas t'aider, mais je suis sur qu'une ame charitable va completer mes infos.
Mes serveur de prod son sous linux, mais je dev sous windows.
J'ai essayer d'utiliser une version d'iconv pour mais bon j'ai pas reussi a le faire marcher.
Pour French Fred
j'utilisai phpedit pour mon code, apparement il ne gère pas l'utf-8, et effectivement avec dreamweaver ca a l'air de marché
Merci a tout les deux.
utf8_encode code la chaîne data au format UTF-8 , et retourne la version codée. UTF-8 est un mécanisme standardisé utilisé par Unicode pour coder les caractère de grande taille dans des flux d'octets. UTF-8 est transparent pour les caractères ASCII , il est auto-synchronisé (c'est à dire qu'un programme peut toujours savoir dans un flux d'octet où un caractère commence), et peut être utilisé pour faire des comparaisons de chaînes standard, comme pour le tri.
ceci étant valable pour PHP >= 3.0.6 et supérieurs
okay?!
Bizarre, bizarre, ya une semaine j'ai lu que cette fonction ne marchait que sous linux parce qu'elle utilise iconv justement, et là je ne vois rien justement dans la doc. Je l'essaye et ca marche effectivement sous windows
Cool.
Cool.
-

BadProcESs - WRInaute accro

- Messages: 2656
- Inscription: Lun Juil 28, 2003 15:58
Heu... Et utf8_encode() tout simplement ne convidendrait-il pas ?
BadProcESs a écrit:Heu... Et utf8_encode() tout simplement ne convidendrait-il pas ?
oui c'est ce que Didier_S a dit
- Tchinkatchuk
- WRInaute impliqué

- Messages: 287
- Inscription: Mar Avr 22, 2003 14:00
de mon coté, iconv marche tres bien de la facon suivante :
- Code: Tout sélectionner
$chaine = iconv('UTF-8', 'ASCII//TRANSLIT',$chaine);
Mais est-ce que les conversions par utf8_encode sont vraiment necessaires?
Dans le cadre d'un site multilingue, où il est plus que recommandé d'écrire toutes les expressions, phrases dans des fichiers séparés (textes ou xml), la conversion à t-elle vraiment un sens?
Pour mes sites, je fais des fichiers textes enregistrés en utf-8 et mes scripts se chargent de lire ces fichiers et les réécrire tel-quels au navigateur, aucun besoin de convertir quoi que ce soit.
C'est, à mon humble avis, la meilleure solution car elle est très modulable (l'ajout d'une langue n'est en fait qu'un ajout de fichier) et évite tous les problèmes de conversion d'encodage...
Dans le cadre d'un site multilingue, où il est plus que recommandé d'écrire toutes les expressions, phrases dans des fichiers séparés (textes ou xml), la conversion à t-elle vraiment un sens?
Pour mes sites, je fais des fichiers textes enregistrés en utf-8 et mes scripts se chargent de lire ces fichiers et les réécrire tel-quels au navigateur, aucun besoin de convertir quoi que ce soit.
- Code: Tout sélectionner
[menu]
menu=メインメニュー
home=ホーム
tabs=タブ譜
submit=タブ譜を推薦
links=リンク集
[languages]
languages=Languages
en=English
ja=日本語
fr=Français
es=Español
etc etc
C'est, à mon humble avis, la meilleure solution car elle est très modulable (l'ajout d'une langue n'est en fait qu'un ajout de fichier) et évite tous les problèmes de conversion d'encodage...
Bonjour,
L'utilisation des jeux de caractères et références d'entité est loin d'être simple.
Quelques liens utiles :
- Introduction aux jeux de caractères
- L'encodage des caractères, fiches de la présentation de Normand Lamoureux et fichier audio (W3CQuébec)
- Caractères spéciaux et encodage
- UTF-8 sous SciTE, configuration
Pour éviter bien des déconvenues, il ne faut jamais oublier que
Amicalement,
Monique
L'utilisation des jeux de caractères et références d'entité est loin d'être simple.
Quelques liens utiles :
- Introduction aux jeux de caractères
- L'encodage des caractères, fiches de la présentation de Normand Lamoureux et fichier audio (W3CQuébec)
- Caractères spéciaux et encodage
- UTF-8 sous SciTE, configuration
Pour éviter bien des déconvenues, il ne faut jamais oublier que
Normand Lamoureux a écrit: * que l'encodage se produit au moment d'enregistrer le fichier
* que pour être correcte, la déclaration d'encodage doit correspondre à celle qui fut réellement utilisée
* qu'il ne suffit pas de changer la déclaration d'encodage pour qu'un changement d'encodage se produise
* que les éditeurs de texte ne sont pas également fiables en matière d'encodage et de changement d'encodage
Amicalement,
Monique
maxttb a écrit:Mais est-ce que les conversions par utf8_encode sont vraiment necessaires?
Dans le cadre d'un site multilingue, où il est plus que recommandé d'écrire toutes les expressions, phrases dans des fichiers séparés (textes ou xml), la conversion à t-elle vraiment un sens?
utf8_encode c'est pour les textes qui viennent de la base de donnée et qui chez ne sont pas stockés en utf-8 mais en je sais pas quoi.
Sinon c'est clair que l''utilisation de fichier est très pratique, je peut gérer le même site dans plusieurs langues donc l'arabe le chinois et le japonais la dessus www.1001celebrity.com
je vais peut etre dire une anerie, mais pour moi, le plus simple, c'est d" :
1 aller sur yahoo.co.jp pour verifier que tu supportes le charset et le telecharger, le cas echeant
2 aller sur word, copier coller le texte que tu veux
3 enregistrer sous html
4 fermer, réouvrir sur dreamweaver, nettoyer le code
5 vérifier le code, et la, découvrir "oh merveille !" que tout le code est passé en 〹 et consort, ce qui te permet de rester en caractere unicode.
6 le meilleur, c'est que si tu fais un site autoadministrable, tu peux utiliser le richedit (en javascript) pour faire tes conversions a la volée.... top non ?
un bout d'exemple de résultat : http://www.tahiti-tourisme.pf/articles. ... 3&etabid=8
1 aller sur yahoo.co.jp pour verifier que tu supportes le charset et le telecharger, le cas echeant
2 aller sur word, copier coller le texte que tu veux
3 enregistrer sous html
4 fermer, réouvrir sur dreamweaver, nettoyer le code
5 vérifier le code, et la, découvrir "oh merveille !" que tout le code est passé en 〹 et consort, ce qui te permet de rester en caractere unicode.
6 le meilleur, c'est que si tu fais un site autoadministrable, tu peux utiliser le richedit (en javascript) pour faire tes conversions a la volée.... top non ?
un bout d'exemple de résultat : http://www.tahiti-tourisme.pf/articles. ... 3&etabid=8
c'est vrai que c un peu perturbant ces histoire de UTF-8. J'ai fais quelques tentaives dernierement, ou j'ouvrais un flux en UTF-8 (donc deja encodé), mais header html indique que la page etait en utf-8... mais malgre cela, le resultat affiche etait illisible.
Je n'ai pas trouve enormement de tuto expliquant comment dealer avec le monde des formats de caracteres divers et varie
....
Je m'y remettrait un de ces quatre, pour l'instant j'en resterait au carateres + ou - romains
Je n'ai pas trouve enormement de tuto expliquant comment dealer avec le monde des formats de caracteres divers et varie
Je m'y remettrait un de ces quatre, pour l'instant j'en resterait au carateres + ou - romains
- Tchinkatchuk
- WRInaute impliqué

- Messages: 287
- Inscription: Mar Avr 22, 2003 14:00
je devais faire un tutoriel la dessus dur developpez .xxx mais je n'ai aps le temps.
C'est galere a mettre mais quend tout fonctionne, yeepeee !!!
Bon courage en totu cas.
C'est galere a mettre mais quend tout fonctionne, yeepeee !!!
Bon courage en totu cas.
37 messages • Page 1 sur 3 • 1, 2, 3
Formation recommandée sur ce thème :
Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- La calculatrice de Google
- Tiret ou underscore ? Enfin la réponse !
- Google indexe le Flash
- Google News : trucs et astuces
- Google affiche des liens vers des plans de villes
- Google tente d'expliquer le Google Bombing 'Failure'
- Google traque les colis UPS ou FedEx
- Google Images cherche dans l'actualité
- Google ajoute la Navigation par nom dans sa Toolbar
- WebRankExpert, le service professionnel de WebRankInfo
- get_meta_tags et UTF-8
- Problème UTF-8
- Google et UTF-8 ???
- file_get_contents + UTF-8 + CR/LF
- Encodage UTF-8
- Magpierss et UTF-8
- URL en UTF 8
- adsense pour rss + utf-8
- PHP-MySQL et UTF-8
- [Résolu] UTF-8 et données POST / GET
- UTF 8 et caractéres accentués doublé
- encodage html et utf 8
- UTF-8 ou ISO 8859-1 ?
- UTF-8 : Apostrophe invivible?...
- utf-8 ou ISO-8850-1 ???
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités






le forum