charset=iso-8859-1 ou charset=utf-8 ?

Consultez la formation à Google Analytics de WebRankInfo / Ranking Metrics


Bobez
WRInaute impliqué
WRInaute impliqué
 
Messages: 716
Inscription: 20 Mai 2004

Message le Mer Juin 23, 2004 12:15

Monique a écrit:Il faut quand même retenir que pour utiliser utf-8, il faut un éditeur capable d'enregistrer en utf-8

Exactement ! Même pour le iso-8859-1, il faut bien faire attention d'enregistrer les pages dans cet encodage. Perso, j'utilise BBEdit sous Mac OS X et c'est vraiment le pied :)


metropoway
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 263
Inscription: 3 Mar 2004

Message le Jeu Juin 24, 2004 8:24

Tous ces échanges, pour intéressants qu'ils soient, ne répondent cependant pas tout à fait à la question initiale : est-ce que l'encodage utilisé influe sur l'indexation des pages (sur Google et autres) ?

Merci


Remi L.
WRInaute passionné
WRInaute passionné
 
Messages: 1063
Inscription: 6 Sep 2003

Message le Jeu Juin 24, 2004 13:44

A priori: non.

thepaut
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 16
Inscription: 8 Oct 2003

la différence entre ISO-8859-1, UTF-8 et Windows-1252 ?

Message le Mar Oct 26, 2004 13:02

Je vous conseille vivement le site suivant, pour le respect des standards et pour la clareté de leur explications :
http://openweb.eu.org/articles/jeux_caracteres/

Vous saurez tout sur la différence entre ISO-8859-1, UTF-8 et Windows-1252 ...

zachbora
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 2
Inscription: 29 Aoû 2005

Message le Lun Aoû 29, 2005 20:08

J'ai effectué un test car je voulais savoir si il pouvais y avoir des différences entre les serveurs.

Je suis premièrement aller sur google et effectivement ils utilisent bien utf-8, et malgré le codage de IE placé sur UTF-8, les symboles sont là.

J'ai copier la source sur un de mes sites. http://members.lycos.co.uk/worldcretornica/test.html

Avec les mêmes options, les charactères sont différents.

C'est comme si il y avait une autre variable dépendante.

Je soupçonne le server d'y être pour quelque chose... Le serveur de google.fr est probablement 'français' tandis que mon host est anglais...

Une enquête approfondit s'impose.


jeanluc
WRInaute accro
WRInaute accro
 
Messages: 3049
Inscription: 3 Mai 2004

Message le Lun Aoû 29, 2005 20:39

zachbora a écrit:J'ai copier la source sur un de mes sites. http://members.lycos.co.uk/worldcretornica/test.html

Avec les mêmes options, les charactères sont différents.

Bonjour,

Explication probable :
1. La page Google d'origine est codée en UTF-8.
2. Tu récupères la source et tu l'enregistres sur ton disque local en ISO-8859 ou équivalent.
3. Tu essaies de réafficher la page qui indique au navigateur UTF-8, mais qui est codée en ISO-8859.

Jean-Luc

nodom
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 316
Inscription: 15 Jan 2005

Message le Lun Aoû 29, 2005 21:02

soyons logique
si une page est enrgistée en utf elle s'affiche bien en utf et mal en iso
si une page est enrgistée en iso elle s'affiche bien en iso et mal en utf
si une page est enrgistée en x elle s'affiche bien en x et mal en y

c'est tout à fait logique non? si une page comportant des accents est enrgistrée en utf. il s'affiche correctement en utf.

ceci est dit, je crois que les moteurs se débroillent bien pour retrouver les mots quel que soit l'encodage, mais l'affichage dépend de :
- du codage de la page
- de la confuguration du poste, navigateur et de la présentation de la page par le moteur.

maintenant mon avis:
vous pouvez travailler correctement avec utf, mais vous aurez des problèmes:
vous deveriez modifier toutes vos page et avoir un éditeur qui permet l'enrgisterement en utf (pas les tag) blocnote le permet.
après vous auriez quelque problèmes à régler avec mysql.
conseil: iso.

zachbora
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 2
Inscription: 29 Aoû 2005

Message le Ven Nov 11, 2005 2:03

ce que j'ai fini par faire c'est de mettre toute mes page en UTF8 et de remplacer les characteres speciaux par leur equivalent html. Lorsque je place les infos dans ma DB je laisse les signes mais quand j'affichage, j'utilise une fonction php qui remplace tout les charactere speciaux.


touffy-chouchen
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 28
Inscription: 20 Sep 2004

Message le Ven Jan 20, 2006 18:51

Remi L. a écrit:C'est vrai que pour l'instant, il y a encore beaucoup de problèmes mais l'UTF-8 est une bonne solution quand on veut afficher plusieurs langues avec un même jeu de caractères. Une fois en utf-8, il n'y a théoriquement plus aucune limitation à l'affichage (si ce n'est sous windows de charger les jeux de caractères idoines).

C'est certainement pour cela que Google ou Dmoz sont passés en utf-8.


De plus certains lecteur css préconise l'utf8. Par exemple pour faire un lecteur de flux rss sous flash, il faut que celui ci soit encodé en utf8 pour etre lut correctement.

dgavarin
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 1
Inscription: 26 Nov 2009

Re: charset=iso-8859-1 ou charset=utf-8 ?

Message le Jeu Nov 26, 2009 22:36

je suis tombé par hasard sur ce fil de discussion, si je puis me permettre, on ne peut parler de charset de la page HTML sans parler de l'encoding du flux qui est balancé.

je m'explique, dans les exemple que j'ai vu plus haut, si un utilisateur lambda cree 2 fichiers textes (par exemple sous windows, avec TextPad ou autre), il va naturellement crée des fichiers "Texte", cad vraiment ANSI, et on aura beau spécifier un encoding "utf-8" les accents seront cassés, mais si par contre ce meme fichier sans rien changé dan le contenu, est maintenant enregistré en encoding "utf-8" alors là le navigateur saura bien interprété l'ensemble des caratères du fichier et là les accents ne seront plus cassés.

dgavarin

kenshuri
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 4
Inscription: 2 Mai 2010

Re:

Message le Ven Mai 14, 2010 22:43

Le serveur de google.fr est probablement 'français' tandis que mon host est anglais...

en passant par là: Google est américain que soit .be, .fr, .co.uk etc.

luder
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 2
Inscription: 25 Juin 2010

Re: charset=iso-8859-1 ou charset=utf-8 ?

Message le Ven Juin 25, 2010 11:46

Cette page est en UTF-8 ! Qui a des problèmes avec ? :lol: http://forum.webrankinfo.com/posting.php?sid=86c3e7a84138c46aa336e7c9ddfc8e46#


smorge
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 490
Inscription: 17 Juin 2009

Re: charset=iso-8859-1 ou charset=utf-8 ?

Message le Ven Juin 25, 2010 13:09

donc j'ai du mal a suivre : je débute en html et j'ai pris l'habitude de mettre ma page en UFT-8 et de remplacer tous mes caractès comme ça ! Ca va ou ça sert à rien et mieux vaut que j'encode autrement :? ? (Sur tous les navigateurs et systèmes d'exploitation que j'ai testé ça fonctionne.)

luder
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 2
Inscription: 25 Juin 2010

Re: charset=iso-8859-1 ou charset=utf-8 ?

Message le Ven Juin 25, 2010 19:13

Si vous écrivez charset=utf-8 dans votre fichier index.html, il faut aussi modifier le codage de votre fichier index.html pour le passer en utf-8 ! donc le vrai problème est un problème d'éditeur de texte. En principe un bon éditeur sait faire une conversion, mais encore faut-il savoir comment faire. Je vous propose un test:
éditer un fichier avec juste deux lettres "éè", sauvegarder, et observer la taille.
en ISO8859-1 il fait 3 octets, deux lettres et un <EOT>
en utf-8 il fait 5 octets, deux lettres de deux octets et un <EOT>

Si vous savez le passer de 3 à 5 octets, et de 5 à 3 octets avec votre éditeur ... tout va bien pour vous.


christele
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 2
Inscription: 7 Aoû 2010

Re: charset=iso-8859-1 ou charset=utf-8 ?

Message le Sam Aoû 07, 2010 11:11

Bonjour,
Nous vivons dans l'incompréhention totale , je sais combien cela est dur a concevoir,
mais il se dit dans ce sujet tant de choses erronées ...
Il faut revenir aux fondamentaux,

metropoway la réponse a ta question, est que les moteurs traduisent le code des pages en faisant si besoins
le réencodage entre celui de leur page et celui que tu annonces dans ta page web.

Alors pourquoi des "caractéres spéciaux curieux" chez google par exemple sur certaines pages ?
Toujours la même raison, Google passes sur une page déclarée par exemple:
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1" /> ,
alors que le texte a un autre encodage ! voila la raison ...

Donc retiens que dans 99% des cas les pages UTF8 ou iso-8859-1 ou autres ,
seront bien rendues chez google qui est tout UTF-8 si les pages annoncent leur encodage proprement.


Alors ces fondamentaux ?

La réalité est qu' en fait, nous représentons les caractéres selon notre gourmandise

Ou a l'ancienne, a savoir l'ASCII de base qui n'avait que 128 caractéres
ne comportant que les alphanumériques sans accents cédilles etc ...

Ou Gros progrés avec le CP850 des premiers DOS qui sont vite devenu CP850 puis CP1252 avec windows 3

Ou a cause de l' obligation de développer des jeux de caractéres par Pays par exemple notre iso-8859-1

Alors il fallait bien y arriver , un codage apparait , capable de tout inclure en un ...
Le répertoire complet unicode. l'UTF8 par exemple que tout le monde devrait adopter et qui est encore "boudé"
(par moi en premier) l'encodage unicode s'ouvre a 100.000 caractéres.


Quand SIBELIUS dit que
Utf-8, c'est pour les caractères anglophones exclusivement (donc pas d'accent ou de caractères spéciaux)

Je crois réver ...

Du reste toute l'ambiguitée de son test éclaire bien ce que je dis : apparament SIBELIUS
ne se demandes pas comment s'opére un copié/collé de son "voilà" bien lisible comme ici ,
je veux dire dans une page de notre forum qui est en UTF-8 que je saches 8O

Oui Oui entre le copié collé, l'OS qui le prends en mémoire, l'application qui la reçoit etc ...
il y a un long chemin, avec autant de passages par des réencodages :wink:

charset=iso-8859-1 ou charset=utf-8 ? charset=iso-8859-1 ou charset=utf-8 ?

Si vous avez aimé cette discussion, partagez-la sur vos réseaux sociaux préférés :

Formation recommandée sur ce thème :

Formation Google Analytics : en 2 jours, apprenez comment exploiter l'essentiel des possibilités de l'outil de mesure d'audience de Google. Formation animée par les experts Google Analytics de Ranking Metrics.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités