Vérification par des humains, comment ça marche ?

Consultez la formation Google Maps, News, Images de WebRankInfo / Ranking Metrics

padawan2
WRInaute passionné
WRInaute passionné
 
Messages: 590
Inscription: Ven Fév 02, 2007 19:51

Vérification par des humains, comment ça marche ?

Message le Jeu Aoû 16, 2007 2:36

Hello à tous,


je sais que la question a pas mal fait le tour ces derniers temps et je ne pense pas que la réponse finale ait été donnée sur ce forum.

Comment Google fait-il pour identifier et catégoriser les photos contenues dans son index ?
La réponse est tout simplement un jeu !

Luis von Ahn, un brillant universitaire est parti d'un constat statistique simple... en 2003, il estime que 9 Milliards d'heures ont été passées par des gens devant leur ordi à jouer au solitaire.
Il a donc inventé des jeux destinés à associer des mots clé à des images ou bien à identifier précisément les différentes parties des photos.

ça donne donc ça:
Peekaboom
Phetch
ESP Game

Pour en revenir à GG, il semblerait qu'ils utilisent une version brandée Google du jeu ESP Game.... ça donne ça: Google Image Labeler


Si vous êtes anglophones, je vous invite à regarde l'excellente présentation du bonhomme qui semblerait bosser pour GG à présent
http://video.google.com/videoplay?docid ... 0976635143


jardintropical
WRInaute impliqué
WRInaute impliqué
 
Messages: 268
Inscription: Mar Oct 17, 2006 7:11

Re: Vérification par des humains, comment ça marche ?

Message le Jeu Aoû 16, 2007 7:00

padawan2 a écrit:Comment Google fait-il pour identifier et catégoriser les photos contenues dans son index ?

Je viens justement de traduire la page "Google Image Labeler" ici:
http://googr.blogspot.com/2007/08/assoc ... s-sur.html
Il s'agit d'associer les images d'un site à des libellés ou mots clé. Cette association est effectuée en ligne et simultanément par deux humains.

padawan2
WRInaute passionné
WRInaute passionné
 
Messages: 590
Inscription: Ven Fév 02, 2007 19:51

Message le Jeu Aoû 16, 2007 13:29

hé bien ça va, je t'ai fourni un peu plus d'information pour compléter ton article qui est un peu vide ;)

un peu d'investigation ne tue pas !


jardintropical
WRInaute impliqué
WRInaute impliqué
 
Messages: 268
Inscription: Mar Oct 17, 2006 7:11

Message le Jeu Aoû 16, 2007 13:43

padawan2 a écrit:ton article qui est un peu vide ;)

On va dire qu'il se limite à une traduction et une présentation sommaire du dispositif Google de libellé des images.
A vrai dire, j'ai vu tes liens mais je ne suis pas allé voir de plus près. Ca a l'air intéressant à première vue.

padawan2 a écrit:Comment Google fait-il pour identifier et catégoriser les photos contenues dans son index ?
La réponse est tout simplement un jeu !

Pas seulement je pense. Les images ne passent probablement pas toutes par ce filtre humain. Il y a certainement aussi une première identification à partir du contexte de l'image: titre de la page, texte autour de l'image, ancres des liens qui pointent vers la page de l'image,...


st-antigone
WRInaute accro
WRInaute accro
 
Messages: 1384
Inscription: Sam Déc 18, 2004 12:35

Message le Jeu Aoû 16, 2007 16:12

En tout cas voilà une traduction qui permet de faire avancer le schmiblick.
merci de la part de ceux qui ne lisent pas l'anglais. :wink:


cedric_g
WRInaute accro
WRInaute accro
 
Messages: 2022
Inscription: Mer Jan 18, 2006 16:26

Message le Ven Aoû 17, 2007 10:00

jardintropical a écrit:Pas seulement je pense. Les images ne passent probablement pas toutes par ce filtre humain. Il y a certainement aussi une première identification à partir du contexte de l'image: titre de la page, texte autour de l'image, ancres des liens qui pointent vers la page de l'image,...



C'est certain ! Il suffit de voir combien de titres sous forme d'images sont indexés sur certains mots-clés et qui ne collent pas du tout avec le sujet que l'on en attend :roll:

Je pense qu'ils devraient faire déjà un tri sur l'aspect ratio des fichiers (par ex. virer toutes les images de moins de 30x30 pixels, toutes celles qui sont par exemple 8 fois pour longues que large avec une dimension du plus petit côté sous tant de pixels histoire de pas pénaliser les panoramiques, etc...)

Quant à l'identification du contenu des images par des humains, ils ont intérêt à engager des entomologistes, ornithologues et compagnie pour indexer les photos animalières :twisted:


jardintropical
WRInaute impliqué
WRInaute impliqué
 
Messages: 268
Inscription: Mar Oct 17, 2006 7:11

Message le Ven Aoû 17, 2007 10:43

cedric_g a écrit:Quant à l'identification du contenu des images par des humains, ils ont intérêt à engager des entomologistes, ornithologues et compagnie pour indexer les photos animalières

C'est aussi ce que je suis dit: le vocabulaire des mots clé ou libellés associés aux images avec le procédé Google risque d'être sommaire ou basique.

On peut imaginer également que s'il y a une correspondance entre les mots clés attribués par les humains et le contenu de la balise alt de l'image, ou son environnement, cela va favoriser le positionnement de l'image sur ces mots clé. Qui risquent toutefois d'être des mots "pauvres".


Formation recommandée sur ce thème :

Formation Google Maps, Google News et Google Images : apprenez comment optimiser le référencement de votre site pour la recherche universelle et notamment Google Maps, Google Actualités et Google Images. Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités