Bing copie Google !

WRInaute accro
Attention ! Bing ne copie pas Google, il analyse le comportement des usagers. Il se trouve que ces usagers vont souvent sur Google, et que partant de là ils vont souvent sur les résultats des premières places de Google. Bing en déduit que ces sites sont intéressants par rapport à la requête que l'usager a tapé.
Ca frôle la ligne jaune, mais ce n'est pas là même chose que de voler un résultat.
 
WRInaute accro
Donc je suis dans une salle d'examen. Je regarde la copie de mon voisin. Mon voisin a l'habitude d'etre très bon ... MAIS ce n'est pas ce qui m'intéresse. Ce qui m'intéresse c'est de savoir que mon voisin sera lu par des professeurs qui sont des personnages pertinents, et donc je peux le pomper pas parce qu'il a raison, mais parce que sa note montrera que les professeurs le trouvent plus pertinents :)
 
WRInaute accro
Si je surfe sur WebRankInfo avec Internet Explorer et/ou la bing bar (edit) (sans passer par le moteur de recherche) et que je lis certains topics, Bing va penser que ces topics sont plus intéressants. Olivier ne pourra pas attaquer Bing pour plagiat pour autant. Pourtant c'est en lisant son menu et ses descriptions que j'ai fait mon choix. Mais c'est moi qui ai été espionné (de mon plein gré) et j'ai respecté les conditions d'utilisation en cliquant sur les items du menu.
 
WRInaute accro
N'oublions pas les autres révélations de cet article :
- Bing a depuis octobre un nouvel algorithme qui enregistre le comportement des usagers pour déterminer la position de la page
- on peut tricher sur cet algo avec 20 clics
- Google a donné de faux résultats pour piéger Bing
 
Olivier Duffez (admin)
Membre du personnel
pour ceux qui ne comprennent pas bien l'anglais, et pour ceux qui veulent en savoir plus des suites de l'histoire, voici un résumé.

Bing s’inspire des résultats de Google !
Google vient de prouver que Bing exploite le comportement des utilisateurs de Google pour certaines requêtes et utilise cette information pour l’aider à classer également les résultats. Dans certains cas, notamment la longue traîne, le 1er résultat chez Bing se retrouve étrangement égal à celui de Google. Les ingénieurs de Google se plaignent de cette triche… qui est révélée bizarrement au moment où Google est malmené sur le plan de la lutte contre le spam. Explications…

Le scoop a été révélé par Danny Sullivan, à qui Amit Singhal (le boss de l’algo Google) et Matt Cutts (le boss de la lutte anti-spam de Google) ont tout révélé. Vous trouverez de explications très détaillées dans son post, que je vous résume ici.

En résumé
Google a acquis la conviction que Bing surveille certains internautes (via Internet Explorer) lorsqu’ils font des recherches sur Google. En plus des sites visités, Bing a accès aux requêtes qui ont été effectuées. Ainsi, le moteur de recherche de Microsoft peut se baser sur les choix faits par l’algorithme de Google (et ses utilisateurs) pour améliorer le sien. C’est justement ce que Google a prouvé, montrant que dans certains cas le 1er résultat d’une requête créée sur-mesure pour des tests est identique sur Bing et Google. Interrogé, Bing n’a pas démenti… (Edit : voir en fin d’article la réaction officielle)

torsoraphy-google.jpg

Sur Google, les résultat correspondent à une correction de la requête

torsoraphy-bing.jpg

Sur Bing il n'y a pas de correction, pourtant le 1er résultat est identique à celui de Google

Le détail de l’histoire
L’histoire a commencé en mai 2010. Google a remarqué que pour des requêtes avec erreur d’orthographe ou de typographie (misspelling), Bing parvenait à renvoyer en 1er résultat le même que Google. Ce qui étonnait surtout Google, c’est que leur algorithme effectuait une correction automatique (dont l’algorithme est jugé pas si simple que ça) alors que Bing ne semblait pas en faire (en tout cas ce n’était pas indiqué). En fait, si ça a piqué tant que ça les ingénieurs de Google, c’est qu’ils sont très fiers de leur système de détection des erreurs de frappe (ou d’orthographe) : ils prétendent que cela fonctionne même pour des requêtes erronées qui n’avaient jusqu’alors jamais été faites.

En octobre 2010, les ingénieurs de Google sont alertés par les valeurs de 2 métriques (apparemment observées régulièrement, on vient de l’apprendre et ça peut faire débat) :
  • parmi les résultats affichés sur les SERP, le pourcentage de résultats identiques (sur Bing et Google) a fortement augmenté
  • le nombre de cas où le tout premier résultat est identique (sur Bing et Google) a lui aussi augmenté
Après ces observations, les équipes de Google ont pensé que Bing utilisait sans doute son navigateur Internet Explorer. En effet, dans ses conditions générales d’utilisation, on peut lire que non seulement la liste des sites web visités peut être transmise à Microsoft, mais aussi les mots-clés tapés dans des formulaires (donc les requêtes Google et les résultats cliqués).

Les ingénieurs de Google ont alors mis en place des tests, que certains pourraient qualifier de vicieux, ayant pour objectif de tendre un piège à Bing afin de prouver cette recopie de résultats. Pour la 1ère fois dans l’histoire de Google (enfin c’est ce qu’on nous raconte), certaines pages web ont été placées manuellement en tête de résultats pour certaines requêtes. On nous rassure en précisant que c’était seulement une centaine de requêtes, que très peu d’internautes peuvent faire sur Google, et qu’une fois l’opération terminée, cette transgression à la règle a pris fin.

Ces requêtes avaient été choisies car elles ne renvoyaient aucun résultat pertinent. Ni Google ni Bing n’était capable de trouver des pages web pertinentes pour ces requêtes. Ensuite Google modifie arbitrairement ses résultats en plaçant en 1er des pages préalablement choisies.

Il a suffi d’une vingtaine d’ingénieurs Google, qui pendant environ 15 jours ont fait ces fameuses requêtes sur leur ordinateur à la maison, avec Internet Explorer muni de la barre d’outils Bing (Bing Toolbar) et la fonctionnalité Suggested Sites activée. Au bout de ces 15 jours, les pages présélectionnées par Google sont apparues en 1ère position sur Bing. Bingo !

Le procédé utilisé par Google pour prouver le comportement de Bing s’appelle en informatique « pot de miel » (honeypot ou honeytrap). Il s’agit en général d’un ordinateur ou d’un logiciel volontairement vulnérable, qui sert à attirer et donc piéger les pirates informatiques…

Explications
En réalité, ce test n’a fonctionné que pour 7 à 9 des 100 requêtes. Danny pense que la raison est que Bing se sert des résultats de Google comme d’un critère pour son algorithme de pertinence. Pour les requêtes « faciles », où les critères traditionnels permettent de trouver les bons résultats sans doute, Bing n’a pas besoin de « l’aide de Google ». Par contre pour les requêtes qui sortent de l’ordinaire, ce critère devient prépondérant, car Bing ne dispose pas de « signaux » autres que le résultat de Google. Donc ces des cas-là, les résultats de Bing se mettent à ressembler furieusement à ceux de Google. Ça ne vous rappelle pas la triche à l’école ? ;-)

Ce qu’il faut en penser
Il est clair que le procédé employé par Bing est très discutable. Pour ma part, j’estime que ce n’est pas correct d’aller ainsi s’inspirer du travail du concurrent. Pour l’instant Google crie à la triche, on verra si l’affaire prend des plus grandes proportions, éventuellement devant les tribunaux. Cela étant, voici quelques points que je soumets à votre réflexion :
  • Les termes utilisés par Google : particulièrement bien choisis, ils simplifient un peu trop la situation, laissant croire au monde entier que Bing n’est plus qu’un clone de Google. En réalité, les résultats cliqués par les utilisateurs de Google ne sont qu’un parmi des centaines de critères utilisés par Bing. Si bien qu’il n’y a en réalité qu’une partie des requêtes qui sont concernées (personne ne pouvant évaluer la proportion).
  • Le calendrier choisi par Google : cela faisait 1 mois que Google avait terminé son fameux test et acquis la certitude que Bing « triche ». Entre temps, la presse a publié plusieurs articles accusateurs, expliquant que la qualité des résultats Google avait fortement baissé, que Google n’arrivait plus à lutter correctement contre le spam. Hier, le 1er février, avait justement lieu un sommet sur l’avenir de la recherche sur Internet et particulièrement de la qualité (search quality). La révélation du scoop quelques heures avant ce sommet a évidemment permis à Google d’éclipser totalement l’ordre du jour…
  • Edmond Lau, ancien employé de Google dans l’équipe qualité, estime que cette pratique est « très raisonnable » et que Bing aurait tort de s’en priver. Il ajoute que Google analyse également les données de navigation des internautes (via sa barre d’outils). Il conclut que si Google se plaint, s’est surtout qu’il a bien plus à perdre que Bing, ce dernier ayant un algorithme pas aussi abouti que le géant des moteurs de recherche.
Voici quelques liens pour vous faire votre propre opinion :
  • l’article de Danny Dullivan sur SearchEngineLand, qui a révélé le scoop
  • la réaction officielle de Bing par Harry Shum, qui « avoue » que Bing utilise les données de surf des internautes, mais qui fournit des justifications
  • l’article de Ami Singhal sur le blog de Google qui officialise la plainte (pas encore devant la justice…) et qui demande à Bing de cesser cette pratique
  • L’avis d’Edmond Lau
Source des images : Danny Sullivan
 
WRInaute passionné
Bing a démenti http://m.zdnet.com/blog/microsoft/microsoft-we-do-not-copy-googles-results/8557
Sauf que les évidences sont là!

Au-delà de cette affaire tragi-comique, quelque chose me perturbe bien plus.
Depuis toujours, je plaide la cause du 100% algorithmique chez Google, réfutant les théories de manipulation manuelle.
Sauf que dans cette histoire, les techos de Google ont tout à fait opéré une manipulation manuelle pour démontrer le plagiat de Bing.
 
WRInaute impliqué
Par contre pour les requêtes qui sortent de l'ordinaire, ce critère devient prépondérant, car Bing ne dispose pas de "signaux" autres que le résultat de Google. Donc ces des cas-là, les résultats de Bing se mettent à ressembler furieusement à ceux de Google.

Si j'ai bien compris il y a eu un piège sur des requêtes que personne ne peut trouver y compris BING.

Comment Bing peut (seulement) copier google sur des requêtes pièges sans automatiser l'ensemble ?

Car l'article ne mentionne que les requêtes (volontairement choisie par Google) sans mentionner les autres de même type.
 
WRInaute accro
Google n'a jamais caché avoir la possibilité de faire des interventions manuelles. (et ils le font dans certains cas, notamment de bombing, si mes souvenirs sont exacts, mais c'est la mécanique inverse, de l'exclusion et pas de la promotion). En revanche, ils seraient fous de le faire régulièrement.
Chaque boite a toujours la possibilité d'outrepasser ses limites et ses sécurités.... mais pour l'admettre aussi ouvertement, ils doivent être vraiment exaspérés par Bing.
 
WRInaute accro
thickparasite a dit:
Depuis toujours, je plaide la cause du 100% algorithmique chez Google, réfutant les théories de manipulation manuelle.
Sauf que dans cette histoire, les techos de Google ont tout à fait opéré une manipulation manuelle pour démontrer le plagiat de Bing.

Trop modeste, tu en oublies d'étayer ça d'un petit lien vers ton dernier article à ce sujet: http://www.laurentbourrelly.com/blog/920.php :mrgreen:
 
WRInaute accro
GUITEL a dit:
Comment Bing peut (seulement) copier google sur des requêtes pièges sans automatiser l'ensemble ?

Car l'article ne mentionne que les requêtes (volontairement choisie par Google) sans mentionner les autres de même type.

En fait Bing a automatiser un processus de copie. Après l'avoir décelé, pour en avoir la certitude, Google a piégé certaines requêtes. Il dit lui même d'ailleurs que seule une partie des requêtes piégées ont été copiées, et qu'il ne sait pas "pourquoi" telle ou telle requête a été choisie.

Ce qui prouve que Bing a introduit dans son "algo" la reprise d'éléments provenant de Google, tempérés par d'autres facteurs inconnus de tous
 
WRInaute passionné
@Hawkeye : j'ai rédigé le billet après avoir posé mon commentaire ;) Mais merci pour le lien.

@Marie-Aude : tu as des sources car j'ai toujours lu ou entendu le contraire. Car j'ai un paquet de propos tenus par des googlers qui réfutent l'intervention manuelle :
* "At Google we do not manually change results.” --Udi Manber, Google VP in Charge of Search Quality, April 16, 2008, in Popular Mechanic
* "Our third philosophy: no manual intervention…The final ordering of the results is decided by our algorithms…, not manually by us. We believe that the subjective judgment of any individual is…subjective, and information distilled by our algorithms…is better than individual subjectivity." --Amit Singhal, Google Fellow in Charge of the Ranking Team, 2008, on The Official Google Blog
* "[O]ur search results are generated objectively and are independent of the beliefs and preferences of those who work at Google" --Lucinda Barlow, Head of Corporate Communications for Google Australia, 2010
* "'Don't be evil' [means] providing our users unbiased access to information." --Google Code of Conduct as provided to investors (first paragraph)
* "[W]e work very, very hard to keep the answers - the natural search answers completely unbiased." --Eric Schmidt on National Public Radio, 2009
* "We never manipulate rankings to put our partners higher in our search results" - Google.com "Our Philosophy"
* "[O]ur crawl process is completely automated; we don't ... manipulate search results by hand." --Google Web Search Help
* “Google’s search results are solely determined by computer algorithms that essentially reflect the popular opinion of the Web. Our search results are not manipulated by hand. We’re not able to make any manual changes to the results." --David Krane, Google spokesman, 2004
* Our "approach to search is" "fully automated." --Sergey Brin, press release, 1999
* "A site's ranking in Google's search results is automatically determined by computer algorithms using thousands of factors to calculate a page's relevance to a given query. ... Our search results are generated completely objectively and are independent of the beliefs and preferences of those who work at Google." --Google's Explanation of Search Results, as it stood through May 2007, as preserved by Wall Street Journal and Archive.org

Source : http://www.benedelman.org/hardcoding/
 
WRInaute impliqué
Et vous pensez que la réponse de Microsoft n'est pas crédible source ?
Microsoft nie le terme de « copie » et avance l'utilisation d'un algorithme très poussé, qui tient compte (de façon anonyme) des recherches des internautes.
Mis également dans l'article d'olivier (en bas) par un ancien de GG
ll ajoute que Google analyse également les données de navigation des internautes (via sa barre d'outils).

2011 je sens une grosse bagarre entre ces deux là dans le monde du search !!
 
WRInaute accro
@Thickparasite Tu as déjà l'article (excellent) de Grimmelmann "Some Skepticism about search neutrality" qui parle de Foundem, et qui considère que Foundem a été réinclus volontairement dans les résultats.
Je te donne le lien vers l'article de Matt Cutts qui cite Grimmelmann
http://www.mattcutts.com/blog/search-neutrality

car Matt Cutts ne dément aucun des points de l'article, et surtout dit
And Grimmelmann independently hits on the reason that Google is willing to take manual action on webspam

Pour le bombing, je n'ai plus les refs en tête
Enfin, certaines pages sont retirées "manuellement" des résultats pour certains pays, ou pour des raisons légales (et c'est indiqué dans ce cas "some pages have been removed from the search results"
 
WRInaute accro
GUITEL a dit:
Et vous pensez que la réponse de Microsoft n'est pas crédible source ?
Microsoft nie le terme de « copie » et avance l'utilisation d'un algorithme très poussé, qui tient compte (de façon anonyme) des recherches des internautes.

Ben c'est exactement la même chose :)

Il est évident que Bing ne va pas mettre des petites mains pour taper toutes les requêtes imaginables et récupérer les résultats sur un bloc note.
Mais "je prends les résultats des recherches des internautes ailleurs" c'est quand même "je prends ce qu'un autre a mis en premier" et donc de la copie :)
 
WRInaute accro
Il n'y a aucune preuve de copie dans ce test. A aucun moment les résultats des recherches ne sont lus par les barres. Si ça doit finir en justice ça risque surtout d'être pour diffamation. Mais la bataille médiatique est sans doute plus intéressante pour ces sociétés qu'un bête procès pour diffamation qui ferait un peu mauvais perdant.

2011 je sens une grosse bagarre entre ces deux là dans le monde du search !!
C'est surtout ça qui est important. Les résultats de Bing sont encore pittoresques, mais avec cet algorithme et l'analyse des données de Facebook, en quelques mois ils peuvent devenir très supérieurs à ceux de Google.
 
WRInaute accro
fredfan a dit:
Il n'y a aucune preuve de copie dans ce test. A aucun moment les résultats des recherches ne sont lus par les barres

Et s'ils lisent que les requêtes comment ils peuvent avoir les mêmes résultats ? le coup de bol ? Ils les lisent pas via les barres, ils les lisent via leur serveur en faisant les mêmes interrogations que les personnes utilisant les barres.
 
WRInaute accro
Ils lisent les requêtes tapées par leurs clients, et les url qui sont transmises au navigateur. Rien ne prouve qu'ils lisent la page. Et bien évidemment s'ils lisaient les résultats directement sur les serveurs Google ça se verrait dans les logs non ?
 
WRInaute accro
fredfan a dit:
Ils lisent les requêtes tapées par leurs clients, et les url qui sont transmises au navigateur. Rien ne prouve qu'ils lisent la page. Et bien évidemment s'ils lisaient les résultats directement sur les serveurs Google ça se verrait dans les logs non ?

Je résume. Ils lisent "machinchose". Ils lisent l'url avec machinchose... et juste avec ca, ils sont capable d'afficher le même résultat que Google alors que Google a volontairement propulsé le site X sur le mot clé Machinchose qui n'a AUCUN rapport avec le site X. C'est ca que tu expliques ?
 
WRInaute impliqué
ba moi je suis un peu comme fredfan

Il a suffi d'une vingtaine d'ingénieurs Google, qui pendant environ 15 jours ont fait ces fameuses requêtes sur leur ordinateur à la maison, avec Internet Explorer muni de la barre d'outils Bing[/b] (Bing Toolbar) et la fonctionnalité Suggested Sites activée. Au bout de ces 15 jours, les pages présélectionnées par Google sont apparues en 1ère position sur Bing. Bingo !

Un moteur de recherche dont 20 personnes sollicitent une requête qui n'existe pas, force (fausse) le résultat de celui ci avec un outil qui suggère .(Suggested Sites activée)

Ce test serait parti de plusieurs browsers avec des variations de positions (forcées dans le temps) dans les serps de google aurait démontré un plagiat.

Là utiliser que des produits MS pour augmenter une requête de type "delhipublicschool40 chdjob" dans les positions de bing, ba je ne suis pas convaincu et je pense également que cette histoire va faire plus de tord à GG qu'à Bing.

il force d'un côté avec Suggested Sites activée source et triche sur leur propre résultat - Je retourne la question "un coup de bol" ou de la manipulation ?
 
WRInaute passionné
@Marie-Aude : les propos de Matt Cutts peuvent être interprété de plusieurs manières. Une action manuelle sur le webspam se traduit par un blacklistage. Ça n'a jamais été nié!

Encore une fois, regarde la collection de liens que j'ai fourni dans mon billet et dont j'ai remis l'extrait texte dans mon post précédent.
Le message a toujours été sans équivoque de la part de Google. Je me rappelle encore une interview (vidéo) de Larry Page qui paraissait offusqué quant le journaliste lui posait cette question. Ta source Matt Cutts n'est pas sans équivoque du tout.
 
WRInaute accro
Le guide Duchemin envoie des testeurs dans les restaurants pour conseiller ses clients.
Je crée un guide basé sur la popularité des restaurants en envoyant mes agents compter le nombre de personnes qui entrent dans ce restaurant, et le temps qu'elles y restent.
Si beaucoup de personnes ont lu le guide Duchemin et entrent dans un restaurant, je vais répercuter à mes clients que c'est un bon restaurant parce que beaucoup de gens y vont, et qu'ils aiment ce qu'ils mangent parce qu'ils y restent longtemps.
Ma méthode est douteuse, mais je n'ai pas lu le guide Duchemin et je ne l'ai pas copié.
Si ses éditeurs veulent me piéger, ils envoient 20 salariés chez un garagiste, et j'écris un article disant que c'est un bon restaurant. J'ai l'air con mais je ne peux pas être poursuivi.
 
WRInaute accro
fredfan a dit:
Le guide Duchemin envoie des testeurs dans les restaurants pour conseiller ses clients.

Oui sauf que selon tes dires, les testeurs ont juste pu voir la vitrine du restaurant et sont incapables de lire le menu. Donc il aurait bien du mal à l'afficher, ce menu. S'il l'affiche, c'est bien qu'ils sont entrés dans le resto.
 
WRInaute accro
fredfan a dit:
Le resto n'appartient pas à Duchemin et il n'est pas écrit sur la prote "interdit aux agents du guide fredfan"

Donc les agents du guide Fredfan voient le menu... donc ils sont rentrés dans le resto... et donc Bing ne se contente pas de récupérer les requêtes comme tu le disais depuis le début. Ils récupèrent aussi le menu en allant, non pas demander au resto, mais en le prenant directement dans le guide Duchemin.
 
WRInaute accro
finstreet a dit:
Ils récupèrent aussi le menu en allant, non pas demander au resto, mais en le prenant directement dans le guide Duchemin.
Je ne vois pas où tu vois ça dans le test de Google ?
Tu crois que les ingénieurs de Google ne savent pas lire une adresse IP qui ferait des millions de requêtes ?
 
WRInaute accro
fredfan a dit:
finstreet a dit:
Ils récupèrent aussi le menu en allant, non pas demander au resto, mais en le prenant directement dans le guide Duchemin.
Je ne vois pas où tu vois ça dans le test de Google ?
Tu crois que les ingénieurs de Google ne savent pas lire une adresse IP qui ferait des millions de requêtes ?

Comment Bing peut il savoir que la requete dans le moteur est en tête ? C'est ca la question. Elle est simple.
 
WRInaute accro
Marie-Aude a dit:
ça s'appelle scrapper une page html, non ?

ah non mais je sais techniquement comment faire... la question c'est que fredfan soutient que Bing n'a jamais visité la page. Donc pour Fredfan, Bing a :

- Mot demandé
- Url de la requete
- Lien cliqué (car page d'après la requete)

Je ne vois que cette possibilité sans aller vérifier la page de la requete justement, et encore ca donnerait pas de résultats parfaits.
 
WRInaute accro
Ben c'est justement le point litigieux. Google considère que comme les pages promues n'ont aucun rapport avec le mot clé en question, Bing s'est manifestement contenté de pomper leurs résultats sans aller vérifier de visu les infos transmises par la bing bar
 
WRInaute accro
Ce que je défend c'est que le fait que l'usager ait visité un site ne prouve pas que ce site était en première position. Il peut aussi bien décider de visiter le 5°. Ce n'est donc pas la position du site selon Google qui est utilisée, mais le choix de l'internaute. Si dans le test les résultats faussés avaient été en 1° position, que les testeurs aient visité le site en 5° et que Bing ait retenu le site en première place comme le meilleur, là on aurait pu parler de plagiat.
 
WRInaute accro
fredfan a dit:
Ce que je défend c'est que le fait que l'usager ait visité un site ne prouve pas que ce site était en première position. Il peut aussi bien décider de visiter le 5°. Ce n'est donc pas la position du site selon Google qui est utilisée, mais le choix de l'internaute. Si dans le test les résultats faussés avaient été en 1° position, que les testeurs aient visité le site en 5° et que Bing ait retenu le site en première place comme le meilleur, là on aurait pu parler de plagiat.

D'accord. On y arrive

Donc BIng a juste suivi le chemin :

Mot pourri > Requete sur Google > Site

Et n'a pas lu la page. Donc partant de ce principe, pour des mots pourris, Bing devrait aussi faire la même chose pour Exalead non, vu qu'il regarde pas la page, non ? A moins qu'il donne une "prime de pertinence" à GG
 
WRInaute accro
Google suit les utilisateurs. Par quel hasard se retrouverait-il sur les sites conseillés par Exalead ?
Imagines que tu veuilles faire un palmarès des meilleures stations de métro et que tu suives les utilisateurs. Tu te retrouverais plus souvent à Chatelet qu'à Mabillon.
 
WRInaute impliqué
Déjà s'il y avait a redire, cela serait déjà devant les tribunaux et Google réclamerait des millions/milliards à Microsoft.

Très fort Bing, suivre les internautes, repèrer les sites qu'ils aiment pour une recherche donnée via la Bing bar, avec leur autorisation et la proposer à d'autres, malin.
 
WRInaute accro
fredfan a dit:
Google suit les utilisateurs. Par quel hasard se retrouverait-il sur les sites conseillés par Exalead ?
Imagines que tu veuilles faire un palmarès des meilleures stations de métro et que tu suives les utilisateurs. Tu te retrouverais plus souvent à Chatelet qu'à Mabillon.

Donc si l'internaute est passé par Google (et non un autre moteur) avant de visiter un site, et après avoir tapé une requête, Bing considèrera cela comme encore plus pertinent... hum hum... tu t'enfonces là
 
WRInaute accro
Ca ne prend pas avec moi finstreet. Ca ne m'énerve pas du tout. Mais si tu reconnais que tu t'es trompé je serai très fier par contre, parce que ce serait une première :)
 
WRInaute accro
fredfan a dit:
Ca ne prend pas avec moi finstreet. Ca ne m'énerve pas du tout. Mais si tu reconnais que tu t'es trompé je serai très fier par contre, parce que ce serait une première :)

Me tromper parce que tu dis que Bing apporte un poids plus important dans son analyse comportementale aux internautes ayant cliqué sur un lien provenant de Google, prouvant ainsi qu'ils utilisent la pertinence de GOogle pour leur propre moteur ? C'est ca se tromper ? T'as pas du bien lire. Ceci dit, tu extrapoles. Soit ils utilisent cette méthode de pertinence, soit ils scrutent les résultats GG... dans les deux cas, ils utilisent le moteur GG pour améliorer leur moteur. Et donc dans les deux cas, tu as tort :)
 
WRInaute accro
Ce n'est pas important que nous ayons tort. Le sujet c'est est-ce que Bing a tort.
La position de Google est indéfendable. Le test est volontairement biaisé.
Aucun test n'a été fait en parallèle avec un autre moteur.
Aucun test n'a été fait avec d'autres positions que la première.
Aucun test n'a été fait en faisant intervenir le comportement de l'utilisateur d'un site autre qu'un moteur de recherches.
Quand on a les moyens de faire un test qui permettrait de couler un concurrent et de gagner des milliards, et qu'on ne le fait pas c'est qu'on sait que ça n'a aucune chance d'aboutir.
Si le problème a été repéré en mars et que le test a été fait en décembre, à quoi ont été utilisés ces 9 mois ?
Que sont devenus les test qui ont forcément été fait dans l'intervalle ?
Si on fait faire les tests en double aveugle par des laboratoires indépendants c'est justement pour éviter ce genre de manipulation.
 
WRInaute accro
Ahhhhhhhhh Mais c'est bien sur. Le test est forcément faux car Exalead n'a pas participé aux tests. Si ca se trouve, Bing n'a pas non plus participé aux tests. On sait jamais, des fois que Bing utiliserait son propre moteur pour améliorer la pertinence de son propre moteur.
 
WRInaute accro
fredfan a dit:
Aucun test n'a été fait en parallèle avec un autre moteur.
Quand tu cherches à prendre un "tricheur" la main dans le sac, tu ne prends pas tout le monde pour déterminer l'échantillon de ceux qui trichent. Par ailleurs le test a été fait parce que Google a remarqué des choses dans les résultats de Bing qu'ils n'ont vues nulle part ailleurs.
Argument non recevable.
fredfan a dit:
Aucun test n'a été fait avec d'autres positions que la première.
Si tant est qu'on puisse s'appuyer sur un CP restreint, ça semble logique.
Cependant,l'article dit que ce Google a remarqué portait uniquement sur la première position. Donc en gros Google dit "j'ai des doutes sur la première position dans Bing, Donc enf ait ce que tu demandes c'est que Google dise "il y a un truc bizarre sur la 1° position, la 2° et les suivantes sont "normales" donc je teste la 1°, la 2° et la 3° pour vérifier qu'il n'y a rien d'anormal".
fredfan a dit:
Aucun test n'a été fait en faisant intervenir le comportement de l'utilisateur d'un site autre qu'un moteur de recherches.
Euh.... comment faire ? :D
Si tu prends le comportement de l'utilisateur en général, tu perds le lien "requête / résultat", donc ça n'a plus aucune valeur.
fredfan a dit:
Quand on a les moyens de faire un test qui permettrait de couler un concurrent et de gagner des milliards, et qu'on ne le fait pas c'est qu'on sait que ça n'a aucune chance d'aboutir.
Oui mais non mais oui mais non. Google est clair sur le fait que la pratique en question n'est pas légalement répréhensible. Donc quoi qu'il en soit, ça ne permettrait pas de couler Bing.
fredfan a dit:
Si le problème a été repéré en mars et que le test a été fait en décembre, à quoi ont été utilisés ces 9 mois ?
A préparer les tests ? :D
Cela dit, l'article parle de Mai 2010 pour "commencer à remarquer des choses et que les vrais drapeaux rouges sont sortis en Octobre 2010
Sur un truc de cette importance, avec les implications que cela peut avoir en terme de confiance, il ne me semble pas anormal qu'on mette deux mois à valider l'anomalie, le principe du test, sa méthode et son encadrement, avant de le réaliser.

More red flags went up in October 2010, when Google told me it noticed a marked rise in two key competitive metrics. Across a wide range of searches, Bing was showing a much greater overlap with Google’s top 10 results than in preceding months. In addition, there was an increase in the percentage of times both Google and Bing listed exactly the same page in the number one spot.
 
WRInaute accro
Plagiat : Microsoft envoie « bouler » Google
Microsoft n’a pas pris de pincettes pour répondre aux accusations lancées hier, mercredi 2 février, par Google. Dans un nouveau billet de blog relatant l’affaire de copie de résultats de recherche, Yusuf Mehdi, vice-président de la firme pour la division des services en ligne, a tenu à mettre les choses au point.
Via
 
WRInaute accro
Ce qui est intéressant dans tout ça, c'est que Bing reconnait prendre les clics en compte pour son classement dans l'algo... je connais plein de petits chinois, de petits russes et de petits indiens qui vont avoir des tendinites :D
 
WRInaute occasionnel
finstreet a dit:
Donc je suis dans une salle d'examen. Je regarde la copie de mon voisin. Mon voisin a l'habitude d'etre très bon ... MAIS ce n'est pas ce qui m'intéresse. Ce qui m'intéresse c'est de savoir que mon voisin sera lu par des professeurs qui sont des personnages pertinents, et donc je peux le pomper pas parce qu'il a raison, mais parce que sa note montrera que les professeurs le trouvent plus pertinents :)

Mais alors la ce raisonnement est imparable, je l'enregistre ...
pour mes prochains examens !!! :lol:
 
Olivier Duffez (admin)
Membre du personnel
Bing dément copier Google et hausse le ton
Depuis l’accusation publique de tricherie émise par Google à l’encontre de Bing, Google et Microsoft se sont lancés dans une guerre ouverte sur Internet, par blogs et Tweets interposés.

Après Harry Shum, Yusuf Mehdi prend à nouveau la défense de Microsoft dans un post sur le blog officiel de Bing, clamant ne copier aucun résultat d’aucun concurrent… On le sent très remonté : « We do not copy results from any of our competitors. Period. Full stop. ». Il estime que la démarche de Google est une insulte à ses équipes, « parmi les meilleures du monde en qualité et en pertinence dans la recherche en ligne ».

Il concède néanmoins que leur algorithme de classement exploite des données remontées par l’activité en ligne de certains de leurs utilisateurs (il s’agit des internautes utilisant Internet Explorer avec une certaine configuration sans doute assez répandue). Par contre il qualifie la technique utilisée par Google (Amit Singhal et ses ingénieurs) de « manipulation des résultats de Bing » et même de « fraude au clic », ce qui peut paraître exagéré dans ce cas précis… Il rappelle que les habitués de ces techniques sont des « spammeurs ».

Pour lui, les révélations de Google n’ont rien appris aux experts du secteur, qui savent que des données anonymes recueillies chez les internautes peuvent aider les algorithmes à s’améliorer. Là où il manque certainement de justesse dans ses propos, c’est quand il explique que ces données leur permettent de décider si un site doit « être dans leur index ». Car la plainte de Google ne concerne pas l’indexation mais le positionnement… La nuance est de taille, comme le comprendront les habitués du référencement naturel.

Yusuf Mehdi termine en rappelant l’énorme effort entrepris par Bing Search depuis 2 ans pour créer un nouveau moteur de recherche de nouvelle génération, ne cherchant donc pas à faire un 2ème Google. Il nous apprend que plusieurs grandes améliorations ont été appliquées en octobre 2010 ; il se félicite non sans ironie que Google ait pu repérer une amélioration de la pertinence des résultats (de Bing) !

Au final, nous assistons à une intensification de la concurrence entre les 2 seuls acteurs de la recherche sur Internet aux Etats-Unis (et dans pas mal de pays dans le monde). A force de se justifier, Google et Bing laissent fuiter des informations que les spécialistes ne ratent pas :

  • Google est capable de modifier arbitrairement et manuellement le classement de ses résultats. Hormis pour des raisons légales, ce n’était jamais arrivé et c’était même une base de la défense de Google, qui affirme que ses résultats sont exclusivement le résultat d’algorithmes.
  • Bing (tout comme Google certainement avec au moins Chrome et la toolbar) exploite les données issues du surf des internautes. Jusqu’à quel niveau (problèmes de confidentialité) ? Avec quelle importance dans l’algorithme ? Pour ma part, je pense que la prise en compte du comportement des internautes devrait s’accroître chez les moteurs de recherche. Même si cela apporte d’autres contraintes, c’est une manière de lutter contre le spam, notamment la création de liens que personne ne clique jamais, mais qui contribuent à la popularité des sites qui les reçoivent, et donc à leur visibilité dans les moteurs.
 
Discussions similaires
Haut