Web, Pages Francophones et Pages France

WRInaute impliqué
Quelqu'un connait il exactement les critères de recherche dans l'index Google lorsque pour une même query, on sélectionne successivement Web, Pages Francophones et Pages France ?

Et ceci pour des mots ne tenant pas compte de la linguistique avec une détection de la langue.

Exemple "Golf Hotel" :
Web : 2 090 000 réponses
Pages Francophones : 122 000 réponses
Pages France : 80 300 réponses

Je soupçonne 2 critères censés intervenir dans le SERP :
- Le TLD du site (.fr cela va de soit, ce qui expliquerait la différence entre Pages Francophones et France, il suffit d'appliquer la liste officielle !)
- La géolocalisation de l'adresse IP du site (Il existe quelques tentatives interressantes et quelques bases de données constituée, mais de quoi se sert Google ?)

Mais existe-t-il d'autres critères ?
 
WRInaute passionné
Salut Kendos,

Je pense que le tld n'entre pas en ligne de compte. Mon site en .com sort parfaitement bien dans les "pages Frances". il doit plutôt s'agir de la localisation géographique de l'IP du serveur.

Par exemple, toujours pour mon site, j'ai 1010 pages sur Google dont à peu près la moitié en Anglais.
Dans une recherche "pages France", toutes les pages ressortent, même celles en anglais. Cela démontre bien que ni le tld ni la langue de la page ne comptent.

Pour une recherche sur "Pages Francophones", uniquement les pages en Français ressortent (celles qui contiennent <META HTTP-EQUIV="Content-Language" content="FR"> )

Dan
 
WRInaute occasionnel
Normalement, c'est la localisation de l'adresse IP qui compte, en tout cas, c'est ce que j'espere car je suis revenu chez un hebergeur francais pour cela...
 
WRInaute discret
Exact C'est la localisation du site qui compte.

Pour Francophone cela doit être le paramètre langue des Métas qui rentre en ligne de compte...

Pour France par contre c'est la localisation géographique qui est utilisé et non l’extension.
Au passage je vous suggère NeoTrace qui est un Trace route Graphique très performant pour connaître la localisation d'un site.

Je m’en suis aperçu par rapport à notre site qui est hébergé en Angleterre. Sur France 0 résultat!
Par contre sur -Uk- Google (from the UK) on est présent !!
https://www.google.co.uk/search?hl=en&ie ... CcountryGB
 
Olivier Duffez (admin)
Membre du personnel
le paramètre langue des Métas n'étant pas toujours présent, Google semble avoir la possibilité de détecter à la volée la langue d'un texte (Word sait aussi le faire, ça doit pas être trop dur)
 
WRInaute discret
heu... pour Word Rien de moins sur !!! :lol:

Il arrete pas de vouloir m'installer des langues comme l'Allemand ou le Coréen!!!

Sinon plus serieusement... Oui il existe des techniques de detection de langue par
l'analyse de la frequence des lettres et des mots.
 
WRInaute occasionnel
WebRankInfo a dit:
le paramètre langue des Métas n'étant pas toujours présent, Google semble avoir la possibilité de détecter à la volée la langue d'un texte (Word sait aussi le faire, ça doit pas être trop dur)

Exact. Il me semblait bien que Google n'utilisait pas les balises META pour déterminer la langue. Sinon ce serait trop facile de faire un site dans une langue et de dire à Google qu'il est dans une autre langue.

Google utilise une méthode de reconnaissance automatique de la langue. Il y a longtemps j'avais entendu de la méthode des trigrammes. Ca consiste a couper le texte en groupes de 3 lettres, et à compter le nombre d'occurences pour chaque groupe. Ensuite, en comparant les nombres aux nombres considérés comme "normaux" pour chaque langue, on peut déterminer la langue du texte étudié.
Inconvénients :
- plus le texte est court moins la méthode est précise
- si le texte est en plusieurs langues, ou contient des caractères autre que des lettres (symboles de mathématiques) ça devient difficile à déterminer la langue

Je pense que Google utilise cette méthode ou une méthode similaire (ça n'est certainement pas la seule). Et avec le stock de documents qu'il a, il peut ajuster ses chiffres d'occurences "normales".

Jocelyn
 
WRInaute impliqué
Je ne serai pas si affirmatif en disant que seul la géolocalisation de l'IP entre en compte et pas le TLD.

En creusant un peu, j'ai trouvé ça :

http://www.webmasterworld.com/forum3/6096.htm

Pour la langue, c'est évident, mais je pense que les 3 paramètres doivent entrer en jeux :
GéoIP, TLD, Langue. Mais comment ?

Pour la Géolocation IP, j'utilise plusieurs solutions, mais ne connait aucune base de données vraiment universelle. Google serait il le seul ?
 
WRInaute discret
Tu a certainement raison...

Apres pas mal de test je remarque:

1 l'extension est le Facteur numero 1.
SAUF si l'extension est COM ou NET (Y'en a peut être d'autre...)

Dans ce cas c'est le GEOLOCALISATION qui compte.

Ce que je suis sur c'est que la Langue n'intervient pas... Elle ne sert que pour Francophone.
 
WRInaute occasionnel
Moi, j'ai fait le test suivant :

- ne rien changer a mon site (qui est repere en tant que FRANCOPHONE)
- transferer mon site chez un hebergeur francais
- attendre le resultat de la prochaine DANCE pour voir si je suis dans FRANCE aussi

Et comme je suis impatient de connaitre le resultat, j'aimerais etre alerte par SMS du demarrage de la prochaine DANCE :wink:
 
Discussions similaires
Haut