charset=iso-8859-1 ou charset=utf-8 ?
34 messages
• Page 2 sur 3 • 1, 2, 3
Consultez la formation à Google Analytics de WebRankInfo / Ranking Metrics
-

Bobez - WRInaute impliqué

- Messages: 716
- Inscription: 20 Mai 2004
Monique a écrit:Il faut quand même retenir que pour utiliser utf-8, il faut un éditeur capable d'enregistrer en utf-8
Exactement ! Même pour le iso-8859-1, il faut bien faire attention d'enregistrer les pages dans cet encodage. Perso, j'utilise BBEdit sous Mac OS X et c'est vraiment le pied
-

metropoway - WRInaute occasionnel

- Messages: 263
- Inscription: 3 Mar 2004
Tous ces échanges, pour intéressants qu'ils soient, ne répondent cependant pas tout à fait à la question initiale : est-ce que l'encodage utilisé influe sur l'indexation des pages (sur Google et autres) ?
Merci
Merci
- thepaut
- Nouveau WRInaute

- Messages: 16
- Inscription: 8 Oct 2003
la différence entre ISO-8859-1, UTF-8 et Windows-1252 ?
Je vous conseille vivement le site suivant, pour le respect des standards et pour la clareté de leur explications :
http://openweb.eu.org/articles/jeux_caracteres/
Vous saurez tout sur la différence entre ISO-8859-1, UTF-8 et Windows-1252 ...
http://openweb.eu.org/articles/jeux_caracteres/
Vous saurez tout sur la différence entre ISO-8859-1, UTF-8 et Windows-1252 ...
- zachbora
- Nouveau WRInaute

- Messages: 2
- Inscription: 29 Aoû 2005
J'ai effectué un test car je voulais savoir si il pouvais y avoir des différences entre les serveurs.
Je suis premièrement aller sur google et effectivement ils utilisent bien utf-8, et malgré le codage de IE placé sur UTF-8, les symboles sont là.
J'ai copier la source sur un de mes sites. http://members.lycos.co.uk/worldcretornica/test.html
Avec les mêmes options, les charactères sont différents.
C'est comme si il y avait une autre variable dépendante.
Je soupçonne le server d'y être pour quelque chose... Le serveur de google.fr est probablement 'français' tandis que mon host est anglais...
Une enquête approfondit s'impose.
Je suis premièrement aller sur google et effectivement ils utilisent bien utf-8, et malgré le codage de IE placé sur UTF-8, les symboles sont là.
J'ai copier la source sur un de mes sites. http://members.lycos.co.uk/worldcretornica/test.html
Avec les mêmes options, les charactères sont différents.
C'est comme si il y avait une autre variable dépendante.
Je soupçonne le server d'y être pour quelque chose... Le serveur de google.fr est probablement 'français' tandis que mon host est anglais...
Une enquête approfondit s'impose.
-

jeanluc - WRInaute accro

- Messages: 3049
- Inscription: 3 Mai 2004
zachbora a écrit:J'ai copier la source sur un de mes sites. http://members.lycos.co.uk/worldcretornica/test.html
Avec les mêmes options, les charactères sont différents.
Bonjour,
Explication probable :
1. La page Google d'origine est codée en UTF-8.
2. Tu récupères la source et tu l'enregistres sur ton disque local en ISO-8859 ou équivalent.
3. Tu essaies de réafficher la page qui indique au navigateur UTF-8, mais qui est codée en ISO-8859.
Jean-Luc
- nodom
- WRInaute occasionnel

- Messages: 316
- Inscription: 15 Jan 2005
soyons logique
si une page est enrgistée en utf elle s'affiche bien en utf et mal en iso
si une page est enrgistée en iso elle s'affiche bien en iso et mal en utf
si une page est enrgistée en x elle s'affiche bien en x et mal en y
c'est tout à fait logique non? si une page comportant des accents est enrgistrée en utf. il s'affiche correctement en utf.
ceci est dit, je crois que les moteurs se débroillent bien pour retrouver les mots quel que soit l'encodage, mais l'affichage dépend de :
- du codage de la page
- de la confuguration du poste, navigateur et de la présentation de la page par le moteur.
maintenant mon avis:
vous pouvez travailler correctement avec utf, mais vous aurez des problèmes:
vous deveriez modifier toutes vos page et avoir un éditeur qui permet l'enrgisterement en utf (pas les tag) blocnote le permet.
après vous auriez quelque problèmes à régler avec mysql.
conseil: iso.
si une page est enrgistée en utf elle s'affiche bien en utf et mal en iso
si une page est enrgistée en iso elle s'affiche bien en iso et mal en utf
si une page est enrgistée en x elle s'affiche bien en x et mal en y
c'est tout à fait logique non? si une page comportant des accents est enrgistrée en utf. il s'affiche correctement en utf.
ceci est dit, je crois que les moteurs se débroillent bien pour retrouver les mots quel que soit l'encodage, mais l'affichage dépend de :
- du codage de la page
- de la confuguration du poste, navigateur et de la présentation de la page par le moteur.
maintenant mon avis:
vous pouvez travailler correctement avec utf, mais vous aurez des problèmes:
vous deveriez modifier toutes vos page et avoir un éditeur qui permet l'enrgisterement en utf (pas les tag) blocnote le permet.
après vous auriez quelque problèmes à régler avec mysql.
conseil: iso.
- zachbora
- Nouveau WRInaute

- Messages: 2
- Inscription: 29 Aoû 2005
ce que j'ai fini par faire c'est de mettre toute mes page en UTF8 et de remplacer les characteres speciaux par leur equivalent html. Lorsque je place les infos dans ma DB je laisse les signes mais quand j'affichage, j'utilise une fonction php qui remplace tout les charactere speciaux.
-

touffy-chouchen - Nouveau WRInaute

- Messages: 28
- Inscription: 20 Sep 2004
Remi L. a écrit:C'est vrai que pour l'instant, il y a encore beaucoup de problèmes mais l'UTF-8 est une bonne solution quand on veut afficher plusieurs langues avec un même jeu de caractères. Une fois en utf-8, il n'y a théoriquement plus aucune limitation à l'affichage (si ce n'est sous windows de charger les jeux de caractères idoines).
C'est certainement pour cela que Google ou Dmoz sont passés en utf-8.
De plus certains lecteur css préconise l'utf8. Par exemple pour faire un lecteur de flux rss sous flash, il faut que celui ci soit encodé en utf8 pour etre lut correctement.
- dgavarin
- Nouveau WRInaute

- Messages: 1
- Inscription: 26 Nov 2009
Re: charset=iso-8859-1 ou charset=utf-8 ?
je suis tombé par hasard sur ce fil de discussion, si je puis me permettre, on ne peut parler de charset de la page HTML sans parler de l'encoding du flux qui est balancé.
je m'explique, dans les exemple que j'ai vu plus haut, si un utilisateur lambda cree 2 fichiers textes (par exemple sous windows, avec TextPad ou autre), il va naturellement crée des fichiers "Texte", cad vraiment ANSI, et on aura beau spécifier un encoding "utf-8" les accents seront cassés, mais si par contre ce meme fichier sans rien changé dan le contenu, est maintenant enregistré en encoding "utf-8" alors là le navigateur saura bien interprété l'ensemble des caratères du fichier et là les accents ne seront plus cassés.
dgavarin
je m'explique, dans les exemple que j'ai vu plus haut, si un utilisateur lambda cree 2 fichiers textes (par exemple sous windows, avec TextPad ou autre), il va naturellement crée des fichiers "Texte", cad vraiment ANSI, et on aura beau spécifier un encoding "utf-8" les accents seront cassés, mais si par contre ce meme fichier sans rien changé dan le contenu, est maintenant enregistré en encoding "utf-8" alors là le navigateur saura bien interprété l'ensemble des caratères du fichier et là les accents ne seront plus cassés.
dgavarin
- luder
- Nouveau WRInaute

- Messages: 2
- Inscription: 25 Juin 2010
Re: charset=iso-8859-1 ou charset=utf-8 ?
Cette page est en UTF-8 ! Qui a des problèmes avec ?
http://forum.webrankinfo.com/posting.php?sid=86c3e7a84138c46aa336e7c9ddfc8e46#
-

smorge - WRInaute occasionnel

- Messages: 490
- Inscription: 17 Juin 2009
Re: charset=iso-8859-1 ou charset=utf-8 ?
donc j'ai du mal a suivre : je débute en html et j'ai pris l'habitude de mettre ma page en UFT-8 et de remplacer tous mes caractès comme ça ! Ca va ou ça sert à rien et mieux vaut que j'encode autrement
? (Sur tous les navigateurs et systèmes d'exploitation que j'ai testé ça fonctionne.)
- luder
- Nouveau WRInaute

- Messages: 2
- Inscription: 25 Juin 2010
Re: charset=iso-8859-1 ou charset=utf-8 ?
Si vous écrivez charset=utf-8 dans votre fichier index.html, il faut aussi modifier le codage de votre fichier index.html pour le passer en utf-8 ! donc le vrai problème est un problème d'éditeur de texte. En principe un bon éditeur sait faire une conversion, mais encore faut-il savoir comment faire. Je vous propose un test:
éditer un fichier avec juste deux lettres "éè", sauvegarder, et observer la taille.
en ISO8859-1 il fait 3 octets, deux lettres et un <EOT>
en utf-8 il fait 5 octets, deux lettres de deux octets et un <EOT>
Si vous savez le passer de 3 à 5 octets, et de 5 à 3 octets avec votre éditeur ... tout va bien pour vous.
éditer un fichier avec juste deux lettres "éè", sauvegarder, et observer la taille.
en ISO8859-1 il fait 3 octets, deux lettres et un <EOT>
en utf-8 il fait 5 octets, deux lettres de deux octets et un <EOT>
Si vous savez le passer de 3 à 5 octets, et de 5 à 3 octets avec votre éditeur ... tout va bien pour vous.
-

christele - Nouveau WRInaute

- Messages: 2
- Inscription: 7 Aoû 2010
Re: charset=iso-8859-1 ou charset=utf-8 ?
Bonjour,
Nous vivons dans l'incompréhention totale , je sais combien cela est dur a concevoir,
mais il se dit dans ce sujet tant de choses erronées ...
Il faut revenir aux fondamentaux,
metropoway la réponse a ta question, est que les moteurs traduisent le code des pages en faisant si besoins
le réencodage entre celui de leur page et celui que tu annonces dans ta page web.
Alors pourquoi des "caractéres spéciaux curieux" chez google par exemple sur certaines pages ?
Toujours la même raison, Google passes sur une page déclarée par exemple:
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1" /> ,
alors que le texte a un autre encodage ! voila la raison ...
Donc retiens que dans 99% des cas les pages UTF8 ou iso-8859-1 ou autres ,
seront bien rendues chez google qui est tout UTF-8 si les pages annoncent leur encodage proprement.
Alors ces fondamentaux ?
La réalité est qu' en fait, nous représentons les caractéres selon notre gourmandise
Quand SIBELIUS dit que
Utf-8, c'est pour les caractères anglophones exclusivement (donc pas d'accent ou de caractères spéciaux)
Je crois réver ...
Du reste toute l'ambiguitée de son test éclaire bien ce que je dis : apparament SIBELIUS
ne se demandes pas comment s'opére un copié/collé de son "voilà" bien lisible comme ici ,
je veux dire dans une page de notre forum qui est en UTF-8 que je saches
Oui Oui entre le copié collé, l'OS qui le prends en mémoire, l'application qui la reçoit etc ...
il y a un long chemin, avec autant de passages par des réencodages
Nous vivons dans l'incompréhention totale , je sais combien cela est dur a concevoir,
mais il se dit dans ce sujet tant de choses erronées ...
Il faut revenir aux fondamentaux,
metropoway la réponse a ta question, est que les moteurs traduisent le code des pages en faisant si besoins
le réencodage entre celui de leur page et celui que tu annonces dans ta page web.
Alors pourquoi des "caractéres spéciaux curieux" chez google par exemple sur certaines pages ?
Toujours la même raison, Google passes sur une page déclarée par exemple:
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1" /> ,
alors que le texte a un autre encodage ! voila la raison ...
Donc retiens que dans 99% des cas les pages UTF8 ou iso-8859-1 ou autres ,
seront bien rendues chez google qui est tout UTF-8 si les pages annoncent leur encodage proprement.
Alors ces fondamentaux ?
La réalité est qu' en fait, nous représentons les caractéres selon notre gourmandise
Ou a l'ancienne, a savoir l'ASCII de base qui n'avait que 128 caractéres
ne comportant que les alphanumériques sans accents cédilles etc ...
Ou Gros progrés avec le CP850 des premiers DOS qui sont vite devenu CP850 puis CP1252 avec windows 3
Ou a cause de l' obligation de développer des jeux de caractéres par Pays par exemple notre iso-8859-1
Alors il fallait bien y arriver , un codage apparait , capable de tout inclure en un ...
Le répertoire complet unicode. l'UTF8 par exemple que tout le monde devrait adopter et qui est encore "boudé"
(par moi en premier) l'encodage unicode s'ouvre a 100.000 caractéres.
Quand SIBELIUS dit que
Utf-8, c'est pour les caractères anglophones exclusivement (donc pas d'accent ou de caractères spéciaux)
Je crois réver ...
Du reste toute l'ambiguitée de son test éclaire bien ce que je dis : apparament SIBELIUS
ne se demandes pas comment s'opére un copié/collé de son "voilà" bien lisible comme ici ,
je veux dire dans une page de notre forum qui est en UTF-8 que je saches
Oui Oui entre le copié collé, l'OS qui le prends en mémoire, l'application qui la reçoit etc ...
il y a un long chemin, avec autant de passages par des réencodages
34 messages
• Page 2 sur 3 • 1, 2, 3
Formation recommandée sur ce thème :
Formation Google Analytics : en 2 jours, apprenez comment exploiter l'essentiel des possibilités de l'outil de mesure d'audience de Google. Formation animée par les experts Google Analytics de Ranking Metrics.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- charset=iso-8859-1 ou charset=utf-8 ?
- Charset : ISO-8859-1, ISO-8859-15 ou UTF-8 ?
- Balise meta charset=iso-8859-1
- charset=iso-8859-1 : refaire tout mon site ?
- [Résolu] charset ISO 8859 et accents codés en UTF8
- charset=iso-8859-1 ou ...8859-15 ?
- utf-8, iso-8859-1, iso-8859-15 ?
- UTF-8 ou ISO 8859-1 ?
- différence entre charset=ks_c_5601-1987 et charset=euc-kr
- Quel encodage/charset choisir ? UTF-8
Consultez la description détaillée des produits ou services de Google suivants : Google Site Stats
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités


