Mots clés, charset et multilinguisme :

G
GU
Guest
Bonjour à tous,

:?: Petite question :

Je voudrais savoir si des mots clés étrangers (suivant la langue de la page et donc son charset - pas unicode) seraient pris en compte par les moteurs de recherche ...

et quelqu'un sait-il ce qu'il en est des langues du type chinois, japonais, hebreu, arage, arménien et autres (toujours pas encodés en unicode)

merci !
Gu
 
Nouveau WRInaute
Le japonnais est encode en UTF8 ( unicode sur 8 bits ) : voir :
-https://www.google.co.jp/

Pour répondre a ta question. les crawlers récupérent ta page dans un charset lambda et un encodage lambda. le moteur de recherche transforme cette page et la stocke en utilisant l'encodage de ca base ( probablement utf8 voir 16 ). Lorsq'une recherche est effectué le moteur te resort les urls.

Voila réponse non officielle mais surement assez proche de ce qui ce passe, non ?

A+
 
G
GU
Guest
mots clés, charset et multilinguisme

Salut !

Aucune de mes pages 'est encodée en utf8 ou 16... c'est un choix car à l'époque de l'étude, l'utf8 n'était pas complètement répandu (et l'est-il aujourd'hui?). les charset sont donc ISO ou windows (voire autre selon les cas).

La plupart des sites que je connais dans des langues étrangères ne sont pas encodées en UTF8 ... je doute donc que google ne les référence pas...

concernant la base de donnée, n'est-elle pas en ascii tout simplement ? (enfin j'en sais rien, mais la notre l'est et fait une gestion de encodages pour ressortir du html...)

merci !
 
Discussions similaires
Haut