googlebot sais mieux parler arabe ou utf-8 ?
10 messages • Page 1 sur 1
Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics
googlebot sais mieux parler arabe ou utf-8 ?
Bonjour
j'ai voulu optimiser mon site (arabe) en mettant les titre des articles du site dans la balise <title> resultat : pleins de pages derefferencés car apparement google ne sais pas lire ces titles
exemple :
regardez cette page : http://66.249.93.104/search?q=cache:UCy ... .net&hl=fr
et ce qu'elle devrait etre
-http://www.oujdacity.net/oujda-article-650-fr.html
du coup je suis entrain de retenter une optimisation: je transforme les titre en utf-8 et je les affiche en tan qu'html entities (du style & #1578; )
pensez vous que ça ira mieux ?
et est ceque google vas faire la correspendance entre les htmlentities et les caractères normaux des requetes de recherche ?
j'ai voulu optimiser mon site (arabe) en mettant les titre des articles du site dans la balise <title> resultat : pleins de pages derefferencés car apparement google ne sais pas lire ces titles
exemple :
regardez cette page : http://66.249.93.104/search?q=cache:UCy ... .net&hl=fr
et ce qu'elle devrait etre
-http://www.oujdacity.net/oujda-article-650-fr.html
du coup je suis entrain de retenter une optimisation: je transforme les titre en utf-8 et je les affiche en tan qu'html entities (du style & #1578; )
pensez vous que ça ira mieux ?
et est ceque google vas faire la correspendance entre les htmlentities et les caractères normaux des requetes de recherche ?
Bonjour aladdin,
J'ai testé ta page avec mon simulateur Google. Regarde au bas de la page : on voit que les indications de l'en-tête HTTP (décidée par le serveur) et celle de la balise META "content-type" sont contradictoires, ce qui ne peut que poser des problèmes avec Google.
Quand le type de codage est défini explicitement par l'en-tête HTTP et par une balise META, il est indispensable que ce soit le même codage des deux côtés.
Jean-Luc
J'ai testé ta page avec mon simulateur Google. Regarde au bas de la page : on voit que les indications de l'en-tête HTTP (décidée par le serveur) et celle de la balise META "content-type" sont contradictoires, ce qui ne peut que poser des problèmes avec Google.
Quand le type de codage est défini explicitement par l'en-tête HTTP et par une balise META, il est indispensable que ce soit le même codage des deux côtés.
Jean-Luc
merci j'ai enlever l'encodage spécifié par header()
et maintenant j'obtient ça dans le simulateur
c'est bon comme ça ?
et maintenant j'obtient ça dans le simulateur
En-tête HTTP "Content-Type"
text/html
<META NAME="content-type" CONTENT=" ... ">
text/html; charset=utf-8
c'est bon comme ça ?
Maintenant c'est bon pour les indications de l'encodage.
Je suis étonné que le simulateur n'affiche pas correctement les caractères français accentués de la description. Je n'ai jamais constaté ce problème pour d'autres pages en UTF-8. Je ne sais pas si le problème est de mon côté ou du tien...
Pour la représentation des caractères arabes par le simulateur, je suis heureusement surpris. On dirait que ça marche, même si je n'ai jamais testé d'autres langues que le français et l'anglais.
Jean-Luc
Je suis étonné que le simulateur n'affiche pas correctement les caractères français accentués de la description. Je n'ai jamais constaté ce problème pour d'autres pages en UTF-8. Je ne sais pas si le problème est de mon côté ou du tien...
Pour la représentation des caractères arabes par le simulateur, je suis heureusement surpris. On dirait que ça marche, même si je n'ai jamais testé d'autres langues que le français et l'anglais.
Jean-Luc
bein pour les caractères arabes maintenant ya pas de raison pour que ça marche pas, en fait je les transforme en htmlentities maintenant, pour etre sur qu'ils passent partout
avant ça passait pas, regarde dans le cache que j'ai posté au debut de ce sujet
avant ça passait pas, regarde dans le cache que j'ai posté au debut de ce sujet
Tu as raison. Et en plus, comme ma page est aussi en UTF-8, c'est pas compliqué.
Par contre, pour les caractères accentués français, ça ne marche pas. Or, comme ma page est aussi en UTF-8, ça devrait donner le même résultat que sur ta page. Tu es sûr de tes codes pour les "é" et les "à" ?
Jean-Luc
Par contre, pour les caractères accentués français, ça ne marche pas. Or, comme ma page est aussi en UTF-8, ça devrait donner le même résultat que sur ta page. Tu es sûr de tes codes pour les "é" et les "à" ?
Jean-Luc
bein je suis pas totalement sure pour les caractères accetués, mais en tout cas sur mon site et sur google ça passe bien : -http://www.google.fr/search?q=site%3Aoujdacity.net
en fait, vue que mon site contient de l'arabe et du français, j'ecrit le français en utf-8 et l'arabe en windows-1256 (car des utilisateurs qui postend des articles arabes le font sous cette encodage)
ensuite j'utilise les fonctions ob_* de php pour bufferiser la sortie et avant de l'afficher j'utilise une librairie opour réencoder les windows-1256 en entity utf-8
c'est un peut compliqu, mais c'est la seule methode qui m'a permis d'avoir du contenu mixte (arabe français) supportant les deux jeu de caractères sur la meme page
en fait, vue que mon site contient de l'arabe et du français, j'ecrit le français en utf-8 et l'arabe en windows-1256 (car des utilisateurs qui postend des articles arabes le font sous cette encodage)
ensuite j'utilise les fonctions ob_* de php pour bufferiser la sortie et avant de l'afficher j'utilise une librairie opour réencoder les windows-1256 en entity utf-8
c'est un peut compliqu, mais c'est la seule methode qui m'a permis d'avoir du contenu mixte (arabe français) supportant les deux jeu de caractères sur la meme page
Dans la page http://oujdacity.net/, tu as ceci :
Dans la description, tu emploies & #1571; et & #169; pour faire un "é" et dans la page même, tu emploies & #233; pour un "é". Je pense que ce que tu emploies dans la page est correct, mais pas ce qui est dans la description.
J'ai ajouté des espaces pour que les codes soient visibles.
Jean-Luc
P.S. Il faudrait plutôt écrire Ce site a été créé.
- Code: Tout sélectionner
<META NAME="DESCRIPTION" CONTENT="Un portail sur Oujda et, la r& #1571;& #169;gion du maroc ...
...
Ce site & #224; & #233;t& #233; cr& #233;e ...
Dans la description, tu emploies & #1571; et & #169; pour faire un "é" et dans la page même, tu emploies & #233; pour un "é". Je pense que ce que tu emploies dans la page est correct, mais pas ce qui est dans la description.
J'ai ajouté des espaces pour que les codes soient visibles.
Jean-Luc
P.S. Il faudrait plutôt écrire Ce site a été créé.
10 messages • Page 1 sur 1
Formation recommandée sur ce thème :
Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- La danse de Googlebot :-) La Google Dance
- La calculatrice de Google
- Etude de Googlebot, le robot d'indexation de Google
- Le blog officiel de Google SketchUp
- Googlebot analyse certains codes JavaScript
- Tiret ou underscore ? Enfin la réponse !
- Google indexe le Flash
- Google News : trucs et astuces
- Google affiche des liens vers des plans de villes
- Etude de Googlebot, le robot crawler de Google (Fresh Bot, Deep Bot)
- Le référencement en arabe !
- Commentaires en arabe
- Langue arabe
- moteur de recherche en arabe
- comment réferencer site en arabe ?
- Y a t-il un arabe dans la salle ? - RESOLU
- Quequ'un parle t'il arabe ?
- Référencement d'un blog Wordpress en Arabe
- Adsense pour les sites en arabe
- Repartition des moteurs de recherche en Langue Arabe
- anoonces google en arabe sur l'u nde mes sites
- google ne veut plus me parler
- parler des parrainages
- On peux parler de quelque chose ?
- Statuts de société, parler des revenus pub ?
Consultez la description détaillée des produits ou services de Google suivants : Googlebot
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités






le forum