Messages: 329

Enregistré le: 24 Juil 2004

Message le Sam Juin 03, 2017 7:29

Hello,

Si vous avez un peu de temps... je prends volontiers votre avis sur la pertinence lors d'une recherche sur mon moteur de home pages (la partie moteur svp et pas celle de l'annuaire). Pour l'adresse du site, voir sous ma signature

J'ai changé le poids des mots selon le titre, le texte html et l'url d'un site. il me semble avoir trouvé un bon compromis mais des avis externes m'intéressent :P

En toute transparence, j'utilise donc le full text (php/mysql) ou je multiplie le poids des termes trouvés par

0.90 pour le titre
0.25 pour les mots clefs
0.65 pour la description
0.60 pour l'url
1.70 pour le texte html de la home page

Je précise et comme il s'agit d'un petit projet perso, les requêtes doivent avoir entre 2 et 5 termes. Il y a un peu près 1800 sites sur cette base de données, donc, il est normal que certaines recherches ne donnent rien...Ce n'est ni google ou bing :wink: le but est d'atteindre maxi 3000 sites. (Çà ne doit pas être une usine...ça doit rester humain et il n'a pas la vocation de trouver des plombiers dans un canton ou un département spécifique..)

Pour précision;

- La soumission d'un site est manuel (uniquement la home page d'une url)
- la mise à jour d'un site se fait tous les 10 jours
- une trentaine de sites ont une MAJ 3 fois par jours (quelques sites de news...)
- une 15aines n'ont pas de MAJ (inutile pour des sites comme FB, GG, Youtube, bing, twitter etc..)
- une recherche "sms" ou avec des grosses fautes d’orthographes ne donnera rien... il n'y a pas de correcteur ou de suggestion

D'avance merci pour votre retour sur uniquement la PERTINENCE et excellente journée.
Yule
Haut
9 Réponses
Messages: 37930

Enregistré le: 7 Juil 2004

Message le Sam Juin 03, 2017 8:31

Bonjour,

Il faudrait faire des tests pour les poids, mais au moins dans les 10 premiers résultats il y a les sites utiles.
Il serait bien d'avoir une mise à jour manuelle si souhaitée par celui qui gère le site ou SEO.

Cordialement.
Haut
Messages: 329

Enregistré le: 24 Juil 2004

Message le Sam Juin 03, 2017 16:34

Madrileño a écrit:Il serait bien d'avoir une mise à jour manuelle si souhaitée par celui qui gère le site ou SEO.


Hello,

Merci bien pour ce premier retour. S'agissant de la suggestion des MAJ en mode manu, extra ! A voir dans un proche avenir :D
Celui qui ne souhaite pas attendre l'intervalle des 10 jours avant un update pourra demander un update live et instantané.

Bonne bonne
Yule
Haut
Messages: 329

Enregistré le: 24 Juil 2004

Message le Jeu Juin 08, 2017 21:34

Hello,

Madrileño a écrit:Il serait bien d'avoir une mise à jour manuelle si souhaitée par celui qui gère le site ou SEO.


Cette possibilité est maintenant disponible, par contre, cette dernière est volontairement contraignante pour éviter les abus.. et il faudra chercher un peu pour y accéder :wink: (faut faire sans cookies, sans membre etc.. )

Sinon d'autres retour sur la pertinence ou dois-je en déduire au vu des lectures de ce fil, que tout roule ?

Bonne bonne, le week-end approche à grand pas !

Yule
Haut
Messages: 8552

Enregistré le: 14 Mai 2003

Message le Ven Juin 09, 2017 8:04

yule a écrit:j'utilise donc le full text (php/mysql)

Tu n'avais pas utilisé PostgreSQL avant ?
Haut
Messages: 329

Enregistré le: 24 Juil 2004

Message le Ven Juin 09, 2017 9:06

spout a écrit:
Tu n'avais pas utilisé PostgreSQL avant ?


Non pas moi.. Ou j'avais mal répondu en son temps.
Sinon, jamais utilisé PostgreSQL (à tort ou à raison..)
A+
Yule
Haut
Messages: 8552

Enregistré le: 14 Mai 2003

Message le Ven Juin 09, 2017 9:13

@yule: OK, je viens de voir, j'ai confondu avec dazoo. Sorry pour le hors sujet.
Haut
Messages: 329

Enregistré le: 24 Juil 2004

Message le Mar Juin 20, 2017 8:23

Hello,

J'ai hésité un petit moment sur le fait de rajouter un certain poids dans la pertinence de mes résultats, pour les sites ayants le protocole de transfert hypertexte sécurisé, httpS.

En finalité, j'ai opté pour un affichage d'une clef verte dans les résultats et ainsi, ne pas changer la pertinence si le site est en https ou pas. Finalement, il n'y a pas de raison de pénaliser un site sans ce protocole, le dicta de certain n'est pas celui de tous !

Bonne bonne
Yule
Haut
Messages: 2501

Enregistré le: 24 Fév 2005

Message le Mar Juin 20, 2017 11:00

Salut !

Peut-etre un indice pour le balisage Hn ? Ca me semble beaucoup pour la description souvent bourrée de mots clé ... a voir, et aussi beaucoup pour le texte par rapport a l'URL et le Titre.

Pour des algo de pertinence, tu as Le cosinus de Salton, la pondération BM25 de Robertson ... Je les utilises en partie sur la beta de premsgo, avec d'autres maisons. Ca ne convient pas a tous les sites.

Tu peux extraire les urls externes et faire un tout petit peu de pagerank, sans la faire a la google sinon tu n'a que les gros sites (qui trichent pour bcp).
Haut
Messages: 329

Enregistré le: 24 Juil 2004

Message le Mar Juin 20, 2017 11:31

Extra merci !

Je ne connaissais pas bien ces deux algos, enfin un peu mieux le premier que le second ( je le découvre !)

Y a de quoi s'instruire a tout âge :P merci.
See you
Yule
Haut