Latent Semantic Indexing (LSI) dans l'algo de Google

Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics


cariboo
WRInaute passionné
WRInaute passionné
 
Messages: 769
Inscription: Sam Fév 08, 2003 11:09

Message le Lun Fév 28, 2005 15:07

Il est pratiquement impossible à mon avis de savoir si Google utilise un algo de type LSI ou n'importe quel autre algo permettant d'avoir un critère basé sur la linguistique statistique et les mesures de similarité.

Mais il est hautement probable que Google utilise effectivement depuis quelque temps un algorithme sophistiqué, plus sophistiqué que les mesures à base de tf*idf.

Quelques tests avec la commande "tilde" démontrent de toute façon que Google a à sa disposition un thesaurus, voire une ontologie complète.

Ce qui me laisse perplexe (et apparemment je ne suis pas le seul) c'est que rien ne permet de penser que les changements de classement apparus récemment aient quelque chose à voir avec cela...

Quant à LSI, c'est un vieux serpent de mer concernant google, qui ressort aussi souvent que l'algo Hilltop...

Au fait, LSI ne permet pas tout seul de déterminer la thématique d'une page...

Mac Fruitos
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 172
Inscription: Sam Juin 28, 2003 10:00

Message le Sam Mar 26, 2005 12:10

Existe t-il un site référence en matière de champ sémantique pour trouver des synonymes proches à un mot donnée ? Sinon la solution reste de regarder les sites bien placés sur une requête et de regarder quels mots du titre ou de la description se rapprochent du mot-clef.

Voici un exemple de recherche sémantique sur Google qui met en évidence que même sur les recherches francophones le ~ peut s'appliquer : ~renault
(mais je soupconne fort que ce soit du au fait que la recherche a un sens en anglais et que les mots associés : CLIO et NISSAN sont valables pour les anglo-saxons aussi)


ocsima
WRInaute passionné
WRInaute passionné
 
Messages: 601
Inscription: Sam Sep 04, 2004 14:13

Message le Sam Mar 26, 2005 15:40

Si quelqu'un connaît un équivalent français à WordNet
Merci


rituel
WRInaute accro
WRInaute accro
 
Messages: 1176
Inscription: Sam Mar 15, 2003 23:58

Message le Sam Mar 26, 2005 16:01



yannouk
WRInaute accro
WRInaute accro
 
Messages: 2138
Inscription: Sam Oct 11, 2003 12:35

Message le Sam Mar 26, 2005 16:21

rituel a écrit:http://elsap1.unicaen.fr/cgi-bin/cherches.cgi


J'utilise souvent, tres pertinent!


ocsima
WRInaute passionné
WRInaute passionné
 
Messages: 601
Inscription: Sam Sep 04, 2004 14:13

Message le Sam Mar 26, 2005 16:25

rituel a écrit:http://elsap1.unicaen.fr/cgi-bin/cherches.cgi

Oui merci de me le rappeler et des progrès ont été faits
Mais avez-vous pu downloader quelque chose ?


rituel
WRInaute accro
WRInaute accro
 
Messages: 1176
Inscription: Sam Mar 15, 2003 23:58

Message le Sam Mar 26, 2005 16:36

Non, par contre si tu essayes de faire ce à quoi je pense, à savoir de la suggestion de mots-clefs dynamiques le tout enrobé d'URL-Rewriting à la Kelkoo, tu trouveras peut être de quoi faire ici.


ocsima
WRInaute passionné
WRInaute passionné
 
Messages: 601
Inscription: Sam Sep 04, 2004 14:13

Message le Sam Mar 26, 2005 16:55

rituel a écrit:Non, par contre si tu essayes de faire ce à quoi je pense, à savoir de la suggestion de mots-clefs dynamiques le tout enrobé d'URL-Rewriting à la Kelkoo, tu trouveras peut être de quoi faire ici.

Non pas tout à fait. Je réfléchis à la possibilité d'une extension sémantique de requêtes suivie d'une classification des pages retournées.

caro
WRInaute passionné
WRInaute passionné
 
Messages: 871
Inscription: Lun Juil 21, 2003 18:13

Message le Mar Mar 29, 2005 17:43

salut,

je suis en phase de conclusion concernant des test effectués sur la sémantique grâce à un thésaurus.

pour l'instant (je dis bien pour l'instant) tous les tests analysés montrent que google.FR ne réagit pas du tout à l'insertion de clés synonymes, racines et ou similaires

pour effectuer ces tests j'ai crée un thésaurus de quelques termes et fais des pages de liaisons, contenus, densités, ..., égales.
aucune page développée de manière sémantique ne permet à google de lui conférer un sens supplémentaire et de lui faire prendre le dessus par rapport à une page "normale".

conclusion actuelle :
google n'utilise pas de critères sémantiques dans son algo actuel.

ps: je suis entièrement d'accord avec cariboo, les changements actuels n'ont aucun rapport avec des changements d'algo au niveau de la sémantique.


WebRankInfo
Administrateur du site
Administrateur du site
 
Messages: 15914
Inscription: Ven Avr 19, 2002 19:51

Message le Mar Mar 29, 2005 18:15

Merci caro pour ton retour d'expérience très intéressant ;-)


MagicYoyo
WRInaute accro
WRInaute accro
 
Messages: 2565
Inscription: Lun Mai 24, 2004 15:33

Message le Mer Mar 30, 2005 8:29

Bravo et merci de partager ces vérifications empiriques qui demandent beaucoup de travail.

Kanta
WRInaute impliqué
WRInaute impliqué
 
Messages: 341
Inscription: Ven Oct 22, 2004 0:12

Message le Lun Avr 25, 2005 13:51

MagicYoyo a écrit:D'ailleurs, l'effet Sandbox pourrait s'expliquer par un filtre sémantique :

Les sites (jeunes ou pas ?) vers lesquels affluent des liens dénués de pertinence thématique seraient filtrés ??

J'avoue que ca correspond assez au profil de mes 2 sites sandboxés...


Je ne pense pas car on est normalement pas responsable des bls vers notre site. Si ton site est bien construit et utile il obtiendra naturellement des bls de personnes qui le jugent intéressant, sans pour autant que le site sur lequel ils placent ce bl soit du même thème que le tien.


MagicYoyo
WRInaute accro
WRInaute accro
 
Messages: 2565
Inscription: Lun Mai 24, 2004 15:33

Message le Lun Avr 25, 2005 16:37

Ouep, je me range à ton avis (le message que tu cites date un peu).

Il y a bien une difficulté à positionner un site jeune.
Et il y a bien des pénalités pour les campagnes de création de backilinks artificiels... ce qui renforce la difficulté à référencer un site jeune.

pocketmofo
Nouveau WRInaute
 
Messages: 7
Inscription: Jeu Sep 07, 2006 18:38

Message le Sam Sep 30, 2006 13:39

Oui google fait de l'analyse semantique mais à un niveau tres superficiel.

J ai realise des test sur des sites multilangues et une conclusion parait claire: les particules ont une importance majeure.
Par exemple des particules comme : Vom, Von , Der, Aus qui sont allemandes feront que votre page sera reference dans la langue allemande quelquesoit le langage declaré dans la page.

J'imagine que leur algorithmes travaille sur la proportion de ses particules par rapport au nombre total de mots dans la page. Enfin ca n'est qu'une hypothèse.

Google n'ira pas jusqu'a vérifier le sens d'une phrase, ni la disposition des mots dans celle ci.

txcx
WRInaute discret
WRInaute discret
 
Messages: 86
Inscription: Jeu Juil 06, 2006 15:30

Message le Mar Oct 10, 2006 11:05

Il existe aussi l'atlas sémantique développé par le CNRS ici : http://dico.isc.cnrs.fr

Je l'utilise très régulièrement et il donne bien l'idée de ce que l'on peut attendre des notions de "sens" et "concept".

Latent Semantic Indexing (LSI) dans l'algo de Google Latent Semantic Indexing (LSI) dans l'algo de Google

Formation recommandée sur ce thème :

Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités