encodage des caractères : ça marche, ça marche pas

WRInaute accro
Bonjour,

J'ai un phénomène curieux sur mon blog. Pour autant que je puisse voir, les pages s'affichent correctement avec tous les navigateurs et l'encodage des caractères est bien compris par tous les moteurs.

Pourtant quand je regarde le code source de la page d'accueil avec Internet Explorer (=> Affichage => Source), certains caractères accentués ne sont pas bien décodés. Cela donne "Référencement" pour le titre de la page http://www.annuaire-info.com/referencement/.

Ce qui est encore plus étrange, c'est que le problème n'apparaît pas dans les autres pages du blog. Voir, par exemple, la page http://www.annuaire-info.com/referencement/resultats-complementaires/ dont la source contient "Référencement".

Je ne vois pas d'explication au niveau de la balise
Code:
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />

Jean-Luc
 
WRInaute passionné
lol

le prob c'est justement la balise

utf_8 ==> americain = sans accents


ISO-8859-1 = europe = accents
rog
 
WRInaute accro
Salut Jean Luc :wink:
pourquoi n'utilises-tu pas
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">

C'est peut-être la question idiote du week end ! :roll:
Bon dimanche
Fred :D

ps: grillé sur le fil par rog
 
WRInaute passionné
fredwat a dit:
C'est peut-être la question idiote du week end !

C'est surtout les reponse idiotes du weekend :roll:

Ta page est correcte et correctement encodee (en UTF-8). Je pencherais pour une bogue dans IE. Peut-etre une tentative de detection du charset.

Essaye de supprimer les entites dans la description (&eacute; ...). Mon intuition est que ca vient de la.
 
WRInaute accro
Serious a dit:
C'est surtout les reponse idiotes du weekend :roll:

Bon ben merci et bon week :arrow:

ps: en voici une autre (de réponse idiote):
64 pages pages reconnues sur la totalité de ton site; le reste est en duplicate content...
J'ai horreur de me faire rembarrer de la sorte (mais avec un peu d'humour ça ne pose aucun problème...)
 
WRInaute accro
Merci pour les réponses, mais UTF-8 devrait fonctionner avec des accentués français (ou n'importe quels autres caractères particuliers).

Serious, je pensais aussi à un problème de navigateur qui essaie de comprendre par lui-même quel est le type d'encodage de la page en passant outre aux indications de "Content-Type".

C'est bon avec Firefox. Si c'est un bug IE, c'est curieux qu'avec Opera, ça ne marche pas non plus.

Jean-Luc
 
WRInaute passionné
tout le monde sait qu'il faut utiliser l'iso 8859 pour avoir les caractères accentués

y a que serious qui ne le sait pas

pour une raison obscure, les navigateurs ne prennent que les 128 premiers caractères de la table ascii ==> 7bits

www.asciitable.com (pour voir lesquels)

si tu vas la tu te rendra compte qu'ils n'englobent pas les accentués

il faudrait donc déclarer 8 bits (1 octet) pour avoir les 256 caractères et par conséquent avoir les accentués

l'iso-8859 comprend moins de caracteres +- 120 mais la norme a été conçue spécialement pour notre alphabet

je pourrai en écrire plus, mais je vais arrêter la

rog
 
WRInaute discret
rog a dit:
lol

le prob c'est justement la balise

utf_8 ==> americain = sans accents


ISO-8859-1 = europe = accents
rog

N'importe quoi, utf-8 contient aussi les caractères avec accent. Tu crois que les mecs qui ont inventé l'utf auraient voulu créer un jeu de caractères (quasi) universel sans accent :)
 
WRInaute accro
Bien: apparemment aujourd'hui c'est pas le jour des échanges courtois :lol:
rog indiquait une adresse ou source d'informations que tu n'as pas visité :!:
Chacun fait comme il l'entend (point) .
:arrow: de nouveau
 
WRInaute passionné
ça c'est tipique du gars qui n'a aucun argument

mais c'est pas grave, je ne t'en veux pas

7 bits = 7 caracteres
on est en sisteme binaire (base 2)

1111111 = 127

127 parce que :

1*2^0 = 1
+
1*2^1 = 2
+
1*2^2 = 4
+
1*2^3 = 8
+
1*2^4 = 16
+
1*2^5 = 32
+
1*2^6 = 64

= 127

comme le 0 est considéré comme le premier élément, on aura 128 elements

on pourrait peut etre forcer le navigateur en declarant une meta du style :

content-transfert-encoding : 8bits

mais je n'ai jamais essayé parce que les iso-8859 a été créé pour nos alphabets

rog
 
WRInaute passionné
fredwat a dit:
Serious a dit:
C'est surtout les reponse idiotes du weekend :roll:
Bon ben merci et bon week :arrow:
J'ai horreur de me faire rembarrer de la sorte (mais avec un peu d'humour ça ne pose aucun problème...)
Ok, j'aurais du ecrire: "les reponses deplacees/erronees". Mais ca n'aurait pas repondu a ta question. Peut-etre ai-je aussi fait preuve d'une mauvaise humeur deplacee.
fredwat a dit:
64 pages pages reconnues sur la totalité de ton site; le reste est en duplicate content...
Ce site* n'est pas optimise pour Google (ou meme les autres moteurs de recherches). Il est optimise pour les visites (a partir de liens). C'est un choix en raison de la nature du site.
* a l'exception des pages pour les competitions SEO
rog a dit:
comment je dois je prendre ?
Comme tu veux. Si possible bien. Par contre je maintiens que ta reponse est fausse.

Pour info, l'iso-8859-1 est en train de disparaitre car il est limite a 256 caracteres. Donc il n'inclut meme pas l'ensemble des caracteres europeens (iso-8859-2, iso-8859-3, ...) et encore moins les caracteres asiatiques, hebreux, arabes, cyrilliques, ...

A l'inverse, l'unicode (UTF-8, -16, -32, ...) permet de coder 2 milliards de caracteres (meme si en pratique je crois me souvenir qu'il n'y a que 90000 caracteres definis actuellement). L'unicode inclut donc toutes les lettres francaises, y compris les lettres accentuees mais aussi les accents seuls :D les ligatures et plein d'autres subtilites.

Rog, tu as raison, l'iso-8859-1 a ete cree pour nos alphabets. Mais c'etait il y a 30 ans (ou plus). Il va disparaitre et etre remplace par l'Unicode. D'ailleurs, Windows et Java sont en Unicode (en interne) depuis longtemps. Et plusieurs distributions Linux propose l'option UTF-8 a l'installation.
http://www.unicode.org/

fredwat a dit:
serious ne dit jamais d'ânerie
bien sur que si. et dans ce cas, je compte sur vous pour les relever. sinon on apprendrait jamais rien.
 
WRInaute passionné
les jeux de caractères sont polémiques

au moins j'ai quelqu'un en face qui comprend ce que j'écris

et le sujet qui nous diffère diffère aussi beaucoup d'informaticiens

ps : je n'ai personnellement jamais réussi à avoir les accentués en utf-8 sous linux

rog
 
WRInaute discret
Rog c'est au moins la dixième fois en deux jours qu'on corrige tes âneries, j'avais fini par croire que c'était un concurrrent de wri qui venait pourrir le forum, mais non :)
:arrow: http://fr.wikipedia.org/wiki/Utf-8 tu verras les caractères au delà du 128ème sont codés sur plusieurs octets.

PS: le coup du MVC c'est le meilleur. Je la mets de coté celle là.
 
Discussions similaires
Haut