encodage des caractères : ça marche, ça marche pas

Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics


jeanluc
WRInaute accro
WRInaute accro
 
Messages: 2651
Inscription: Lun Mai 03, 2004 14:48

encodage des caractères : ça marche, ça marche pas

Message le Dim Sep 24, 2006 10:18

Bonjour,

J'ai un phénomène curieux sur mon blog. Pour autant que je puisse voir, les pages s'affichent correctement avec tous les navigateurs et l'encodage des caractères est bien compris par tous les moteurs.

Pourtant quand je regarde le code source de la page d'accueil avec Internet Explorer (=> Affichage => Source), certains caractères accentués ne sont pas bien décodés. Cela donne "Référencement" pour le titre de la page http://www.annuaire-info.com/referencement/.

Ce qui est encore plus étrange, c'est que le problème n'apparaît pas dans les autres pages du blog. Voir, par exemple, la page http://www.annuaire-info.com/referencement/resultats-complementaires/ dont la source contient "Référencement".

Je ne vois pas d'explication au niveau de la balise
Code: Tout sélectionner
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />


Jean-Luc


rog
WRInaute accro
WRInaute accro
 
Messages: 1662
Inscription: Jeu Sep 21, 2006 2:32

Message le Dim Sep 24, 2006 10:30

lol

le prob c'est justement la balise

utf_8 ==> americain = sans accents


ISO-8859-1 = europe = accents
rog


fredwat
WRInaute accro
WRInaute accro
 
Messages: 3182
Inscription: Mer Fév 11, 2004 19:46

Message le Dim Sep 24, 2006 10:31

Salut Jean Luc :wink:
pourquoi n'utilises-tu pas
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">

C'est peut-être la question idiote du week end ! :roll:
Bon dimanche
Fred :D

ps: grillé sur le fil par rog


Serious
WRInaute accro
WRInaute accro
 
Messages: 2438
Inscription: Lun Nov 21, 2005 18:29

Message le Dim Sep 24, 2006 10:55

fredwat a écrit:C'est peut-être la question idiote du week end !


C'est surtout les reponse idiotes du weekend :roll:

Ta page est correcte et correctement encodee (en UTF-8). Je pencherais pour une bogue dans IE. Peut-etre une tentative de detection du charset.

Essaye de supprimer les entites dans la description (&eacute; ...). Mon intuition est que ca vient de la.


fredwat
WRInaute accro
WRInaute accro
 
Messages: 3182
Inscription: Mer Fév 11, 2004 19:46

Message le Dim Sep 24, 2006 10:59

Serious a écrit:
C'est surtout les reponse idiotes du weekend :roll:



Bon ben merci et bon week :arrow:

ps: en voici une autre (de réponse idiote):
64 pages pages reconnues sur la totalité de ton site; le reste est en duplicate content...
J'ai horreur de me faire rembarrer de la sorte (mais avec un peu d'humour ça ne pose aucun problème...)
Dernière édition par fredwat le Dim Sep 24, 2006 11:13, édité 1 fois.


jeanluc
WRInaute accro
WRInaute accro
 
Messages: 2651
Inscription: Lun Mai 03, 2004 14:48

Message le Dim Sep 24, 2006 11:05

Merci pour les réponses, mais UTF-8 devrait fonctionner avec des accentués français (ou n'importe quels autres caractères particuliers).

Serious, je pensais aussi à un problème de navigateur qui essaie de comprendre par lui-même quel est le type d'encodage de la page en passant outre aux indications de "Content-Type".

C'est bon avec Firefox. Si c'est un bug IE, c'est curieux qu'avec Opera, ça ne marche pas non plus.

Jean-Luc


rog
WRInaute accro
WRInaute accro
 
Messages: 1662
Inscription: Jeu Sep 21, 2006 2:32

Message le Dim Sep 24, 2006 11:08

@Serious

comment je dois je prendre ?

rog


fredwat
WRInaute accro
WRInaute accro
 
Messages: 3182
Inscription: Mer Fév 11, 2004 19:46

Message le Dim Sep 24, 2006 11:16

Laisse tomber :!:
serious ne dit jamais d'ânerie (il n'en fait pas non plus)
ciao :arrow:


rog
WRInaute accro
WRInaute accro
 
Messages: 1662
Inscription: Jeu Sep 21, 2006 2:32

Message le Dim Sep 24, 2006 11:49

tout le monde sait qu'il faut utiliser l'iso 8859 pour avoir les caractères accentués

y a que serious qui ne le sait pas

pour une raison obscure, les navigateurs ne prennent que les 128 premiers caractères de la table ascii ==> 7bits

www.asciitable.com (pour voir lesquels)

si tu vas la tu te rendra compte qu'ils n'englobent pas les accentués

il faudrait donc déclarer 8 bits (1 octet) pour avoir les 256 caractères et par conséquent avoir les accentués

l'iso-8859 comprend moins de caracteres +- 120 mais la norme a été conçue spécialement pour notre alphabet

je pourrai en écrire plus, mais je vais arrêter la

rog

julisube
WRInaute impliqué
WRInaute impliqué
 
Messages: 255
Inscription: Lun Juin 26, 2006 21:05

Message le Dim Sep 24, 2006 11:55

rog a écrit:lol

le prob c'est justement la balise

utf_8 ==> americain = sans accents


ISO-8859-1 = europe = accents
rog


N'importe quoi, utf-8 contient aussi les caractères avec accent. Tu crois que les mecs qui ont inventé l'utf auraient voulu créer un jeu de caractères (quasi) universel sans accent :)


rog
WRInaute accro
WRInaute accro
 
Messages: 1662
Inscription: Jeu Sep 21, 2006 2:32

Message le Dim Sep 24, 2006 12:08

lol

plus l'explication est technique et plus elle est dure à comprendre ?

rog

julisube
WRInaute impliqué
WRInaute impliqué
 
Messages: 255
Inscription: Lun Juin 26, 2006 21:05

Message le Dim Sep 24, 2006 12:13

rog a écrit:lol

plus l'explication est technique et plus elle est dure à comprendre ?

rog


Moi pas comprendre, toi avoir fumé ?


fredwat
WRInaute accro
WRInaute accro
 
Messages: 3182
Inscription: Mer Fév 11, 2004 19:46

Message le Dim Sep 24, 2006 12:19

Bien: apparemment aujourd'hui c'est pas le jour des échanges courtois :lol:
rog indiquait une adresse ou source d'informations que tu n'as pas visité :!:
Chacun fait comme il l'entend (point) .
:arrow: de nouveau


rog
WRInaute accro
WRInaute accro
 
Messages: 1662
Inscription: Jeu Sep 21, 2006 2:32

Message le Dim Sep 24, 2006 12:32

ça c'est tipique du gars qui n'a aucun argument

mais c'est pas grave, je ne t'en veux pas

7 bits = 7 caracteres
on est en sisteme binaire (base 2)

1111111 = 127

127 parce que :

1*2^0 = 1
+
1*2^1 = 2
+
1*2^2 = 4
+
1*2^3 = 8
+
1*2^4 = 16
+
1*2^5 = 32
+
1*2^6 = 64

= 127

comme le 0 est considéré comme le premier élément, on aura 128 elements

on pourrait peut etre forcer le navigateur en declarant une meta du style :

content-transfert-encoding : 8bits

mais je n'ai jamais essayé parce que les iso-8859 a été créé pour nos alphabets

rog


Serious
WRInaute accro
WRInaute accro
 
Messages: 2438
Inscription: Lun Nov 21, 2005 18:29

Message le Dim Sep 24, 2006 13:07

fredwat a écrit:
Serious a écrit:C'est surtout les reponse idiotes du weekend :roll:

Bon ben merci et bon week :arrow:
J'ai horreur de me faire rembarrer de la sorte (mais avec un peu d'humour ça ne pose aucun problème...)

Ok, j'aurais du ecrire: "les reponses deplacees/erronees". Mais ca n'aurait pas repondu a ta question. Peut-etre ai-je aussi fait preuve d'une mauvaise humeur deplacee.
fredwat a écrit:64 pages pages reconnues sur la totalité de ton site; le reste est en duplicate content...

Ce site* n'est pas optimise pour Google (ou meme les autres moteurs de recherches). Il est optimise pour les visites (a partir de liens). C'est un choix en raison de la nature du site.
* a l'exception des pages pour les competitions SEO
rog a écrit:comment je dois je prendre ?

Comme tu veux. Si possible bien. Par contre je maintiens que ta reponse est fausse.

Pour info, l'iso-8859-1 est en train de disparaitre car il est limite a 256 caracteres. Donc il n'inclut meme pas l'ensemble des caracteres europeens (iso-8859-2, iso-8859-3, ...) et encore moins les caracteres asiatiques, hebreux, arabes, cyrilliques, ...

A l'inverse, l'unicode (UTF-8, -16, -32, ...) permet de coder 2 milliards de caracteres (meme si en pratique je crois me souvenir qu'il n'y a que 90000 caracteres definis actuellement). L'unicode inclut donc toutes les lettres francaises, y compris les lettres accentuees mais aussi les accents seuls :D les ligatures et plein d'autres subtilites.

Rog, tu as raison, l'iso-8859-1 a ete cree pour nos alphabets. Mais c'etait il y a 30 ans (ou plus). Il va disparaitre et etre remplace par l'Unicode. D'ailleurs, Windows et Java sont en Unicode (en interne) depuis longtemps. Et plusieurs distributions Linux propose l'option UTF-8 a l'installation.
http://www.unicode.org/

fredwat a écrit:serious ne dit jamais d'ânerie

bien sur que si. et dans ce cas, je compte sur vous pour les relever. sinon on apprendrait jamais rien.

encodage des caractères : ça marche, ça marche pas

Formation recommandée sur ce thème :

Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités