Corriger des erreurs UTF-8 a posteriori


ecocentric
WRInaute accro
WRInaute accro
 
Messages: 3602
Inscription: 10 Fév 2004

Corriger des erreurs UTF-8 a posteriori

Message le Jeu Aoû 10, 2006 0:42

Bonsoir,

Je cherche à corriger des données UTF-8 qui ont été lues en ISO Latin et qui présentent des erreurs de catactères.

Exemple :

amà‰liorations à€

Existe-t-il des fonctions plus ou moins standards pour nettoyer / corriger ça de manière fiable ?


ecocentric
WRInaute accro
WRInaute accro
 
Messages: 3602
Inscription: 10 Fév 2004

Message le Jeu Aoû 10, 2006 9:04

pas d'idées ?


Bacteries
WRInaute passionné
WRInaute passionné
 
Messages: 1369
Inscription: 27 Mai 2004

Message le Jeu Aoû 10, 2006 9:46

Tu veux faire quoi exactement?
J'ai pas bien saisie, en gros ta chaine en UTF-8 est affichée en ISO?

Si c'est le cas ça risque d'être relou, si tu affiches ta chaine dans un doc en UTF-8 ça te fait quoi?

Sinon y'a utf8_encode & utf8_decode je ne sais pas si c'est adapté à ton problème.


ecocentric
WRInaute accro
WRInaute accro
 
Messages: 3602
Inscription: 10 Fév 2004

Message le Jeu Aoû 10, 2006 10:08

En fait, j'ai un système qui me sort des données qui ont été mal décodées, puisque codées en UTF8 et lues en ISO Latin. Ce que je voudrais savoir, c'est s'il existe des scripts existants fiables pour nettoyer ce genre de chaîne mal décodée. Le problème vient donc de la mauvaise conversion de la châine.

EDIT - "j'ai un système qui me sort" > pose comme principe que ce système ne peut pas être corrigé pour le moment (ce serait évidemment LA solution).


Si vous avez aimé cette discussion, partagez-la sur vos réseaux sociaux préférés :

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités