UTF-8, d'accord mais...

Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics

French Fred
WRInaute impliqué
WRInaute impliqué
 
Messages: 265
Inscription: Jeu Fév 12, 2004 18:19

Message le Ven Juil 01, 2005 18:17

Bonjour,

Je me suis apercu que le fichier que j'ai presente n'est plus disponible.
Et certains d'entre vous sont arrives sur une page 404.

Voici deux fichiers enregistres au format UTF-8:
Ils contiennent des textes dans les langues suivantes:
- arabe
- turque
- chinois
- japonais
- thailandais
- russe

http://coding.le-regent.net/encodage-UT ... 859-1.html
Ce fichier utilise le charset ISO-8859-1, autrement dit le codage latin, mais le codage du fichier est en UTF-8

http://coding.le-regent.net/encodage-UT ... UTF-8.html
Ce fichier utilise le charset UTF-8, autrement dit le codage unicode, et le codage du fichier est en UTF-8

Ce week end, je mettrais quelques exemples en php couple avec une base mysql.

FRed

French Fred
WRInaute impliqué
WRInaute impliqué
 
Messages: 265
Inscription: Jeu Fév 12, 2004 18:19

Message le Sam Juil 02, 2005 10:29

Dans la serie, je veux travailler avec de l'encodage UTF-8, voici l'episode 2.

Voici deux autres exemples bases sur le couple PHP/MySql.
Ces deux pages permettent d'inserer du texte et liste le contenu d'une table.
Pour chaque exemple, vous trouverez la version source de la page

http://coding.le-regent.net/encodage-UTF-8/database.php
Fichier enregistre au format UTF-8 et renvoie de l'ISO-8859-1.
L'affichage des donnees sont correctes mais en editant les sources, on s'apercoit que les textes sont en code html "&...;".

http://coding.le-regent.net/encodage-UT ... _utf-8.php
Fichier enregistre au format UTF-8 et renvoie de l'UTF-8.
Ici les sources de la page sont correctement restituees.

Quelques details sur l'environnement:
- le serveur web est apache en version Apache/1.3.29
- PHP en version 4.3.11
- MYSQL en version 4.0.21

FRed


chantra
WRInaute impliqué
WRInaute impliqué
 
Messages: 257
Inscription: Lun Juin 27, 2005 19:12

Message le Sam Juil 02, 2005 11:31

superbe, ben j'ai trouve ma mission pour la semaine prochaine: supporter tous les type de caracteres :D .

Une petite precision: <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> suffit-il a definir (forcer) l'encodage pour le browser? paske mes dernier test mon laisse perplexe :?

French Fred
WRInaute impliqué
WRInaute impliqué
 
Messages: 265
Inscription: Jeu Fév 12, 2004 18:19

Message le Sam Juil 02, 2005 11:40

oui.

Ce parametre permet d'indiquer au client (navigateur) quel encodage choisir.
Mais il faut aussi indique sous quel format d'encodage, le serveur doit envoyer le resultat.
Pour cela utilise le code suivant:
Code: Tout sélectionner
header('Content-Type: text/html; charset=UTF-8');


Tu trouveras l'exemple dans le debut de la page a l'adresse suivante:
http://coding.le-regent.net/encodage-UT ... utf-8.phps

FRed


chantra
WRInaute impliqué
WRInaute impliqué
 
Messages: 257
Inscription: Lun Juin 27, 2005 19:12

Message le Sam Juil 02, 2005 13:24

merci french fred,

je pense pas que j'aurais trouve ca avant quelques heures de geeking 8) .

bon, week end a la campagne pis la semaine prochaine je test. héhéhéhé


chantra
WRInaute impliqué
WRInaute impliqué
 
Messages: 257
Inscription: Lun Juin 27, 2005 19:12

Message le Mar Juil 05, 2005 20:33

super french fred :D

le coup du header() marche nickel.
est-il possible de conserver des caracteres encodé en utf-8 dans une base mysql qui a priori est en ISO-8859-1?

merci

French Fred
WRInaute impliqué
WRInaute impliqué
 
Messages: 265
Inscription: Jeu Fév 12, 2004 18:19

Message le Mer Juil 06, 2005 9:33

Salut Chantra,

Au risque de me repeter, tu as toutes les informations dans les exemples que j'ai presente, a savoir la page database_utf-8.php:

Dans l'exemple http://coding.le-regent.net/encodage-UT ... _utf-8.php, je sauvegarde un texte d'une langue quelconque dans une table mySQL.
Donc oui, il est possible de sauvegarder les carateres dans une table.

Je t'invite a consulter les sources de l'exemple ici

Le server mysql est en version 4.0.21 (cf: hebergement chez sivit)

FRed


chantra
WRInaute impliqué
WRInaute impliqué
 
Messages: 257
Inscription: Lun Juin 27, 2005 19:12

Message le Mer Juil 06, 2005 11:50

autant pour moi,

effectivement, en inserant les caracteres sous le format utf-8 dans la base, ca marche bien.
maintenant, je me demande s'il n'est pas possible de specifier a apache (a travers le .htaccess) de directement renvoyer ses resultat en utf-8. ceci de maniere a ne pas renvoyer un header("content...utf-8") sur chaque page.

Je suis en train de fouiller, mais ne trouve pas de resultat pour l'instant.

si jamais tu as une idee :)

Tchinkatchuk
WRInaute impliqué
WRInaute impliqué
 
Messages: 287
Inscription: Mar Avr 22, 2003 14:00

Message le Mer Juil 06, 2005 11:56

dans le php.ini tu peux signifier quel type de caractère en entrée et en sortie.
Mais il vaut mieux mettre le charset églaement tout comme il vautmieux encoder tes fichies php, etc en utf-8 et avoir ta base en unicode.

Il y a pas mal de choses a prendre en compte.

French Fred
WRInaute impliqué
WRInaute impliqué
 
Messages: 265
Inscription: Jeu Fév 12, 2004 18:19

Message le Mer Juil 06, 2005 12:14

Avec GG c'est facile ;)

Apres une lecture rapide, il faut ajouter le code suivant dans ton .htaccess:
Code: Tout sélectionner
AddDefaultCharset UTF-8


Je n'ai pas teste mais il y a,peut etre, quelques modifs a faire !?


chantra
WRInaute impliqué
WRInaute impliqué
 
Messages: 257
Inscription: Lun Juin 27, 2005 19:12

Message le Mer Juil 06, 2005 12:38

french fred, tu es le roi :D

mes premieres tentative etait d'ajouter:
Code: Tout sélectionner
php_flag default_charset UTF-8
dans mon .htaccess, mais seulement, cela necessite que la configuration du serveur soit tres lache.

Code: Tout sélectionner
AddDefaultCharset UTF-8
est pile-poil.

desole french fred, mais j'ai cherche google avec des requetes comme ".htaccess force encoding"...

merci mille fois.

French Fred
WRInaute impliqué
WRInaute impliqué
 
Messages: 265
Inscription: Jeu Fév 12, 2004 18:19

Message le Mer Juil 06, 2005 12:47

Pas de probleme.

Any time ;)

FRed


chantra
WRInaute impliqué
WRInaute impliqué
 
Messages: 257
Inscription: Lun Juin 27, 2005 19:12

Message le Mer Juil 06, 2005 16:13

trop bon, mon site peut maintenant étre multilingue.

je peux afficher les flux en:


top classe, encore merci french fred.

reste certains problemes, des flux comme http://feeds2read.net/rssview-570.html qui est celui de vulnerabilite.com ont quelques problemes d'affichage, notemment au niveau des '. mais bon, le resultat est deja pas mal :P .

demoore
Nouveau WRInaute
 
Messages: 9
Inscription: Ven Juin 24, 2005 18:09

Utilisation d'unicode, encodage chinois unicode

Message le Jeu Nov 10, 2005 3:16

Bonjour,

En utilisant unicode, tu règles tout tes problèmes d'afficages.
En revanche je ne sais pas comment les moteurs de recherche réagissent.

Je créé des sites en chinois, pour cela j'utilise le convertisseur Caractère - Chinois => Unicode sur ce site:

-http://www.chine-nouvelle.com/outils/convertisseur-unicode.html

Il doit surement exister l'équivalent pour les autres jeux de lettres ou caractères.

[Edit zecat : ca commence a bien faire demoore ton casage d'url a tout bout de champs. On va pas passer notre vie à les desactiver ![

French Fred
WRInaute impliqué
WRInaute impliqué
 
Messages: 265
Inscription: Jeu Fév 12, 2004 18:19

UTF-8, d'accord mais...

Message le Jeu Nov 10, 2005 10:12

demoore a écrit:Je créé des sites en chinois, pour cela j'utilise le convertisseur Caractère - Chinois => Unicode sur ce site:

-http://www.chine-nouvelle.com/outils/convertisseur-unicode.html[/url]

Il doit surement exister l'équivalent pour les autres jeux de lettres ou caractères.

Je crois que tu confonds unicode et caratere html.
En faite, le site que tu cites converti les carateres chinois en entite html.

le e avec un accent aigu sera sous cette forme:
Code: Tout sélectionner
&eacute;


L'un des principes de l'unicode permet d'ecrire des ideogrammes chinois (par exemple) dans le code source de la page html

Voici un exemple concret:
http://missandhit.blogspot.com/2005/11/ ... l#comments
Un blog en chinois (je ne sais pas de quoi il est question).
En regardant les sources de la page, tu t'aperceveras que les ideogrammes sont present et lisible.
Le codage de la page est de l'UTF8 ainsi que le charset de la page.


demoore a écrit:En revanche je ne sais pas comment les moteurs de recherche réagissent.


Les robots savent lirent le code html des pages, donc pas de soucis de ce cote la ;)

chantra:
As tu resolu ton probleme ?

UTF-8, d'accord mais... UTF-8, d'accord mais...

Formation recommandée sur ce thème :

Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités