Améliorer la pertinence des résultats de Google custom search ?

WRInaute discret
Bonsoir/jour,

j'essaye en ce moment de créer un moteur de recherche personnalisé restreint à un thème, qui comprendra à terme quelques centaines de sites. J'utilise pour cela Google custom search et Google search api, mais je rencontre un très gros problème de pertinence des résultats.

Pour être plus précis, sur beaucoup de requêtes j'obtiens des résultats avec un (ou deux) site qui truste plusieurs résultats dans la première page, voir la totalité et parfois sur les pages suivantes (il ne s'agit pas toujours des mêmes sites).

J'aimerais donc savoir si quelqu'un a une idée de comment régler ou atténuer ce problème ?
J'ai essayé de fouiller dans les paramètres proposés, mais rien de bien concluant, ou alors je suis passé à côté de quelque chose.

On peut noter les sites, mais un site qui truste la première page pour une requête fera les frais du même problème pour une autre requête : impossible de faire des généralités !

Merci de m'avoir lu :)
 
WRInaute impliqué
Bonjour,

Peut être que Google estime que le ou les sites affichés sont les seuls à répondre à cette requête? Peut être la sélection de sites est trop restreinte?
 
WRInaute discret
Merci pour ta réponse,

Je ne l'ai peut-être pas précisé mais quand j'ai ces résultats multiples pour le même domaine, je trouve malgré tout d'autres sites pertinents (d'un point de vue humain en tout cas) en page 5 par exemple. En gros, si je tape "robe d'été" (je dis n'importe quoi) je vais avoir tous les résultats d'un site A avec "robe d'été rouge", "robe d'été bleue", "robe d'été noire"... etc et beaucoup plus loin un autre site qui aura tout de même "robe d'été" en title.
 
WRInaute impliqué
Le problème c'est à mon avis que Google considère le site mal positionné comme bien moins qualitatif que celui qui est affiché plusieurs fois. Pas grand chose à faire à part faire de la pondération manuelle...
 
WRInaute discret
Bigb06 a dit:
Le problème c'est à mon avis que Google considère le site mal positionné comme bien moins qualitatif que celui qui est affiché plusieurs fois.
C'est ce que je me disais aussi mais des domaines qui n'apparaissent presque pas pour certaines requêtes apparaissent très bien pour d'autres requêtes... Il ne s'agit donc pas vraiment d'un problème de qualité globale.


Bigb06 a dit:
Pas grand chose à faire à part faire de la pondération manuelle...
C'est ce que je fais pour l'instant, mais ça coûte cher (paiement à chaque fois pour 10 résultats en plus, même sur la même requête !).

Je suis en train aussi d'essayer YaCy (basé sur Solr) mais c'est pas terrible...
 
Discussions similaires
Haut