Google victime de son filtre bayésien anti spam ?
23 messages • Page 2 sur 2 • 1, 2
Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics
-

anguenot.com - WRInaute passionné

- Messages: 909
- Inscription: Mer Mai 14, 2003 21:35
Merci pour l'exemple de "cliquez" Katia. Il démontre ques des mots français sont bel et bien filtrés. Je n'avais pas remarqué.
Une visite des sites "filtrés" démontre aussi le peu de pertinence du filtre
Une visite des sites "filtrés" démontre aussi le peu de pertinence du filtre
-

anguenot.com - WRInaute passionné

- Messages: 909
- Inscription: Mer Mai 14, 2003 21:35
En testant "moteur de recherche" sur scroogle.org, je me rends compte qu'altavista france est victime du filtre.
Grotesque
Grotesque
Qui vous dit qu'il s'agit bien d'un filtre bayesien ?
Cela à la couleur du truc, mais ce n'est pas forcément cela...
Effectivement, ca en est bien la couleur, et c'est à priori ce qui pourrait expliquer les résultats douteux qu'on observe en ce moment.
Par exemple, pour les mails, il est admis qu'un filtre bayésien arrive à détecter 99% du spam, donc c'est carrément efficace !
Le problème étant les 1% d'erreurs générés qui sont généralement retraités sur le serveur via SpamAssassin ou autre du même genre, et là, on arrive réellement à une solution optimale pour détecter l'ensemble des mails qu'on peut qualifier de spam. Système qui est quand même généralisé chez les fai et hébergeurs, donc certainement fiable.
Le problème de ces 1% restant est que sur un grand volume (par exemple, une bdd de 3,800,000,000 pages indexées
Autre chose aussi, pour qu'un filtre bayésien soit performant, il lui faut apprendre, faire la corrélation entre détection de spam et probabilité de spam comme l'a dit plus haut Katia.
Dans le cas de Google et si on part de l'hypothèse qu'ils ont adapté un tel filtre sur leur base de données, cela implique que le filtre est encore en phase d'apprentissage concernant ce qu'on pourrait appelé sa base 'relationnelle' (correspondance entre detection et probabilité de spam). On sait par expérience que Google ne fait pas de cas particulier et a du réaliser un filtre automatique pour l'ensemble de la base.
Dans ce cas, il est a priori logique que les résultats Google partent dans tous les sens en ce moment car le filtre 'apprend' tous les jours. Ce qui veut dire qu'à terme, d'içi quelques semaines ou quelques mois selon la courbe d'apprentissage de ce filtre, les résultats de Google devraient être beaucoup plus stables, et le filtre TRÉS efficace.
Et ainsi, je me dis qu'il va devenir dans cette hypothèse de plus en plus difficile d'arriver à contourner la puissance d'un tel filtre, et donc le positionnement dans Google sera accessible à beaucoup moins de personnes. D'un autre côté, sur les secteurs d'activités trés concurrentiels, on s'aperçoit effectivement que le ménage a été fait, et plutôt bien !
Ce qui me laisse à penser que ca confirme un peu cette hypothèse car Google via ce filtre retrouve réellement sa pertinence d'antan !
Par contre, quand aux critères de ce filtre ... mystère total encore ..
Si quelqu'un observe des choses flagrantes dans les résultats, je suis preneur !
Bonjour à tous,
Que de posts depuis hier, fort interressants au demeurant.
Katia, je suis d'accord avec toi sur le fond je l'ai dis au début de mon post.
c'est le poid des liens entrants, dans ce filtre, qui m'inquiète: quand le sujet d'un site est précis il est normal que les autres sites le référencent à peu près de la même manière ( pour ma part DMOZ, Voila, Lycos, Francite, pour les plus connus, ne m'ont pas donné le choix du texte ou du titre, et pourtant ce sont les même mots qui reviennent ).
Si justement ! question de malchance. vas voir mon site et dis moi ce qui cloche ( en MP si tu veux ) ( c'est pas une pierre dans le jardin d'Olivier ).
Sur les critères du filtre : commerciaux, sur-optimisation etc...
Je pense qu'il y a des deux : n'oublions pas que GG est une entreprise commerciale dont on attend d'ailleurs l'introduction en bourse pour des montants propres à déstabiliser plus d'un saint.
Le pb là, c'est le tout automatique, pourquoi ne pas avoir un système qui fait remonter des "anomalies" sur les critères, d'ailleurs, qu'évoque Katia et valider ou pas la pertinence des candidats au filtre ? je sais c'est plus GG
autre solution, pourquoi ne pas avoir simplement baissé les critères d'importance des mots dans les liens et les URL ?
GG n'est pas un saint, avec ce filtre, il gagne au grattage et au tirage : je vire les sur-optimiseur ( et d'autres ) ET je promotionne mon buizness ! De toute façon le temps que les internautes s'en apercoivent je peux toujours l'enlever ce filtre, et facilement puisque je n'ai pas changé l'algorythme, vous me suivez ?
Une conséquence du filtre chez moi, c'est un comble, c'est le nb de visites à une page, je suis passé de 21% à plus de 30%
: les internautes ne trouvent plus ce qu'ils cherchent et j'apparait peut-être maintenant là ou je n'y était pas avant, mais l'internaute vient voir parce qu'il n'a pas trouvé ce qu'il cherchait
Sur le nombre de visites je peut pas savoir : 4-5% d'écart n'est pas suffisant. ( Je suis pas là, justement, pour me plaindre et je ne croie pas, Katia, que GG m'en veut ). je suis comme americas, j'ai plein d'autres pages (50000) sur le même thème.
En tous les cas je n'ai pas l'intention de bouger : je vous parie qu'en janvier tout est normal
A+
Francois
Que de posts depuis hier, fort interressants au demeurant.
Katia, je suis d'accord avec toi sur le fond je l'ai dis au début de mon post.
c'est le poid des liens entrants, dans ce filtre, qui m'inquiète: quand le sujet d'un site est précis il est normal que les autres sites le référencent à peu près de la même manière ( pour ma part DMOZ, Voila, Lycos, Francite, pour les plus connus, ne m'ont pas donné le choix du texte ou du titre, et pourtant ce sont les même mots qui reviennent ).
Katia a écrit:Je ne pense pas que les techniques de référencement tout à fait basiques comme celles proposées aux débutants sur WRI posent le moindre problème
vis à vis de ce filtre.
Si justement ! question de malchance. vas voir mon site et dis moi ce qui cloche ( en MP si tu veux ) ( c'est pas une pierre dans le jardin d'Olivier ).
Sur les critères du filtre : commerciaux, sur-optimisation etc...
Je pense qu'il y a des deux : n'oublions pas que GG est une entreprise commerciale dont on attend d'ailleurs l'introduction en bourse pour des montants propres à déstabiliser plus d'un saint.
Le pb là, c'est le tout automatique, pourquoi ne pas avoir un système qui fait remonter des "anomalies" sur les critères, d'ailleurs, qu'évoque Katia et valider ou pas la pertinence des candidats au filtre ? je sais c'est plus GG
autre solution, pourquoi ne pas avoir simplement baissé les critères d'importance des mots dans les liens et les URL ?
GG n'est pas un saint, avec ce filtre, il gagne au grattage et au tirage : je vire les sur-optimiseur ( et d'autres ) ET je promotionne mon buizness ! De toute façon le temps que les internautes s'en apercoivent je peux toujours l'enlever ce filtre, et facilement puisque je n'ai pas changé l'algorythme, vous me suivez ?
Une conséquence du filtre chez moi, c'est un comble, c'est le nb de visites à une page, je suis passé de 21% à plus de 30%
Sur le nombre de visites je peut pas savoir : 4-5% d'écart n'est pas suffisant. ( Je suis pas là, justement, pour me plaindre et je ne croie pas, Katia, que GG m'en veut ). je suis comme americas, j'ai plein d'autres pages (50000) sur le même thème.
En tous les cas je n'ai pas l'intention de bouger : je vous parie qu'en janvier tout est normal
A+
Francois
DAVID86 a écrit:lol... c'est un paris a tenir, mais j'y crois pas trop...
j'aimerais savoir : y a t'il des sites de PR 6 ou plus qui se sont trouvés déclassés?
Romain
1/ c'est de l'espoir plus qu'un pari
2/ OUI : Altavista apparement
mdr
A+
Francois
23 messages • Page 2 sur 2 • 1, 2
Formation recommandée sur ce thème :
Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Algorithme de détection du link spam de masse
- Archive.org n'indexe plus rien depuis le 22 août 2008 ?
- Réflexions sur le fameux rel=nofollow
- Mon site est-il dans la SandBox ? Guide pratique...
- Articles de R et D sur le PageRank, le SpamRank et le spam...
- La valse des rachats de sociétés par Google en mai/juin 2007
- Google Pack s'enrichit de 2 nouveaux logiciels gratuits
- Description du TrustRank de Google
- L'attribut rel="nofollow" sur les liens : lutte contre le spam...
- l'attribut rel=nofollow contre le spam de commentaires ?
Consultez la description détaillée des produits ou services de Google suivants : Google TrustRank
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités





le forum