Google victime de son filtre bayésien anti spam ?

Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics


Americas
WRInaute accro
WRInaute accro
 
Messages: 3380
Inscription: Mer Sep 24, 2003 11:49

Message le Jeu Déc 04, 2003 23:50

Mais on sait que Google ne nous veut pas du mal :lol:

Il veut simplement favoriser ses adsenses :wink:


DAVID86
WRInaute accro
WRInaute accro
 
Messages: 1181
Inscription: Mer Oct 15, 2003 9:48

Message le Ven Déc 05, 2003 0:04

je suis qd même sur que le classement sur des critères géographiques tiens maintenant plus compte du coté commercial que de la pertinence :o) mais tu as raison, katia sur beaucoup de choses :o)
Romain


anguenot.com
WRInaute passionné
WRInaute passionné
 
Messages: 909
Inscription: Mer Mai 14, 2003 21:35

Message le Ven Déc 05, 2003 0:49

Merci pour l'exemple de "cliquez" Katia. Il démontre ques des mots français sont bel et bien filtrés. Je n'avais pas remarqué.

Une visite des sites "filtrés" démontre aussi le peu de pertinence du filtre :?


anguenot.com
WRInaute passionné
WRInaute passionné
 
Messages: 909
Inscription: Mer Mai 14, 2003 21:35

Message le Ven Déc 05, 2003 1:29

En testant "moteur de recherche" sur scroogle.org, je me rends compte qu'altavista france est victime du filtre.
Grotesque :lol:


Siddartha
Nouveau WRInaute
 
Messages: 24
Inscription: Dim Nov 30, 2003 13:59

Message le Ven Déc 05, 2003 1:54

Qui vous dit qu'il s'agit bien d'un filtre bayesien ?
Cela à la couleur du truc, mais ce n'est pas forcément cela...


Effectivement, ca en est bien la couleur, et c'est à priori ce qui pourrait expliquer les résultats douteux qu'on observe en ce moment.

Par exemple, pour les mails, il est admis qu'un filtre bayésien arrive à détecter 99% du spam, donc c'est carrément efficace !
Le problème étant les 1% d'erreurs générés qui sont généralement retraités sur le serveur via SpamAssassin ou autre du même genre, et là, on arrive réellement à une solution optimale pour détecter l'ensemble des mails qu'on peut qualifier de spam. Système qui est quand même généralisé chez les fai et hébergeurs, donc certainement fiable.

Le problème de ces 1% restant est que sur un grand volume (par exemple, une bdd de 3,800,000,000 pages indexées :D), ca génère forcément du n'importe quoi et c'est là que le filtre pèche a priori.

Autre chose aussi, pour qu'un filtre bayésien soit performant, il lui faut apprendre, faire la corrélation entre détection de spam et probabilité de spam comme l'a dit plus haut Katia.

Dans le cas de Google et si on part de l'hypothèse qu'ils ont adapté un tel filtre sur leur base de données, cela implique que le filtre est encore en phase d'apprentissage concernant ce qu'on pourrait appelé sa base 'relationnelle' (correspondance entre detection et probabilité de spam). On sait par expérience que Google ne fait pas de cas particulier et a du réaliser un filtre automatique pour l'ensemble de la base.

Dans ce cas, il est a priori logique que les résultats Google partent dans tous les sens en ce moment car le filtre 'apprend' tous les jours. Ce qui veut dire qu'à terme, d'içi quelques semaines ou quelques mois selon la courbe d'apprentissage de ce filtre, les résultats de Google devraient être beaucoup plus stables, et le filtre TRÉS efficace.

Et ainsi, je me dis qu'il va devenir dans cette hypothèse de plus en plus difficile d'arriver à contourner la puissance d'un tel filtre, et donc le positionnement dans Google sera accessible à beaucoup moins de personnes. D'un autre côté, sur les secteurs d'activités trés concurrentiels, on s'aperçoit effectivement que le ménage a été fait, et plutôt bien !
Ce qui me laisse à penser que ca confirme un peu cette hypothèse car Google via ce filtre retrouve réellement sa pertinence d'antan !

Par contre, quand aux critères de ce filtre ... mystère total encore ..
Si quelqu'un observe des choses flagrantes dans les résultats, je suis preneur !

François
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 241
Inscription: Mer Nov 13, 2002 17:11

Message le Ven Déc 05, 2003 11:59

Bonjour à tous,

Que de posts depuis hier, fort interressants au demeurant.

Katia, je suis d'accord avec toi sur le fond je l'ai dis au début de mon post.
c'est le poid des liens entrants, dans ce filtre, qui m'inquiète: quand le sujet d'un site est précis il est normal que les autres sites le référencent à peu près de la même manière ( pour ma part DMOZ, Voila, Lycos, Francite, pour les plus connus, ne m'ont pas donné le choix du texte ou du titre, et pourtant ce sont les même mots qui reviennent ).

Katia a écrit:Je ne pense pas que les techniques de référencement tout à fait basiques comme celles proposées aux débutants sur WRI posent le moindre problème
vis à vis de ce filtre.

Si justement ! question de malchance. vas voir mon site et dis moi ce qui cloche ( en MP si tu veux ) ( c'est pas une pierre dans le jardin d'Olivier ).

Sur les critères du filtre : commerciaux, sur-optimisation etc...

Je pense qu'il y a des deux : n'oublions pas que GG est une entreprise commerciale dont on attend d'ailleurs l'introduction en bourse pour des montants propres à déstabiliser plus d'un saint.

Le pb là, c'est le tout automatique, pourquoi ne pas avoir un système qui fait remonter des "anomalies" sur les critères, d'ailleurs, qu'évoque Katia et valider ou pas la pertinence des candidats au filtre ? je sais c'est plus GG :wink:

autre solution, pourquoi ne pas avoir simplement baissé les critères d'importance des mots dans les liens et les URL ?

GG n'est pas un saint, avec ce filtre, il gagne au grattage et au tirage : je vire les sur-optimiseur ( et d'autres ) ET je promotionne mon buizness ! De toute façon le temps que les internautes s'en apercoivent je peux toujours l'enlever ce filtre, et facilement puisque je n'ai pas changé l'algorythme, vous me suivez ?

Une conséquence du filtre chez moi, c'est un comble, c'est le nb de visites à une page, je suis passé de 21% à plus de 30% :!: 8O : les internautes ne trouvent plus ce qu'ils cherchent et j'apparait peut-être maintenant là ou je n'y était pas avant, mais l'internaute vient voir parce qu'il n'a pas trouvé ce qu'il cherchait :!:
Sur le nombre de visites je peut pas savoir : 4-5% d'écart n'est pas suffisant. ( Je suis pas là, justement, pour me plaindre et je ne croie pas, Katia, que GG m'en veut ). je suis comme americas, j'ai plein d'autres pages (50000) sur le même thème.

En tous les cas je n'ai pas l'intention de bouger : je vous parie qu'en janvier tout est normal :wink:

A+
Francois


DAVID86
WRInaute accro
WRInaute accro
 
Messages: 1181
Inscription: Mer Oct 15, 2003 9:48

Message le Ven Déc 05, 2003 12:07

lol... c'est un paris a tenir, mais j'y crois pas trop...
j'aimerais savoir : y a t'il des sites de PR 6 ou plus qui se sont trouvés déclassés?
Romain

François
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 241
Inscription: Mer Nov 13, 2002 17:11

Message le Ven Déc 05, 2003 12:21

DAVID86 a écrit:lol... c'est un paris a tenir, mais j'y crois pas trop...
j'aimerais savoir : y a t'il des sites de PR 6 ou plus qui se sont trouvés déclassés?
Romain


1/ c'est de l'espoir plus qu'un pari :lol:
2/ OUI : Altavista apparement :!:

mdr

A+
Francois

Google victime de son filtre bayésien anti spam ?

Formation recommandée sur ce thème :

Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités