Recherche full-text Mysql et fautes d'orthographes
13 messages • Page 1 sur 1
Consultez la formation à Google Analytics de WebRankInfo / Ranking Metrics
Recherche full-text Mysql et fautes d'orthographes
Est-ce qu'il exite un truc tout fait dans msyql pour chercher un mot dans une db en prenant en compte les fautes d'orthographes?
par exemple dans une db contenant les villes de France, une recherche qui sur le mot "Parris" trouverai toute seule "Paris".
par exemple dans une db contenant les villes de France, une recherche qui sur le mot "Parris" trouverai toute seule "Paris".
Perso j'ai fais un script qui gère les fautes d'orthographe mais c'est pas évident.
De plus j'utilise un simple LIKE pour ma recherche
Voici son fonctionnement avec ton exemple:
-je fais une première recherche avec le mot "Paaris"
-pour chaque resultat je calcul la différence entre les 2 variables
-Si un correspond à 100% parfait
-Si aucun résultat ou ressemblance inférieur à par ex 50% je compare chaque entrée de la table avec mon mot clé et je sors celui qui a la plus forte ressemblance.
Voila en gros comment je procède après on peut améliorer pas mal de truc. Je pense que tu peux appliquer ce principe pour la recherche FULL TEXT
De plus j'utilise un simple LIKE pour ma recherche
Voici son fonctionnement avec ton exemple:
-je fais une première recherche avec le mot "Paaris"
-pour chaque resultat je calcul la différence entre les 2 variables
-Si un correspond à 100% parfait
-Si aucun résultat ou ressemblance inférieur à par ex 50% je compare chaque entrée de la table avec mon mot clé et je sors celui qui a la plus forte ressemblance.
Voila en gros comment je procède après on peut améliorer pas mal de truc. Je pense que tu peux appliquer ce principe pour la recherche FULL TEXT
finstreet a écrit:question bete... en full text y'a pas un pb pour les recherches où le mot fait 3 caractères ou moins ?
par défaut il est à 4 caractères, ça se configure dans le my.cnf comme ceci si l'on peut :
- Code: Tout sélectionner
ft_min_word_len = 3
julienr a écrit:finstreet a écrit:question bete... en full text y'a pas un pb pour les recherches où le mot fait 3 caractères ou moins ?
par défaut il est à 4 caractères, ça se configure dans le my.cnf comme ceci si l'on peut :
- Code: Tout sélectionner
ft_min_word_len = 3
Alors ca c très très sympa
Merci
Se coder une recherche phonétique n'est pas monstrueux ... j'avais fait ca il y a quelques années . C'ets juste une histoire de remplacement de chaine de type
ai en e
ou en u
y en i
au en o
eau en o
que final en c
qu en c
th en t
dedoublonnage de rr en r tt en t ss en s
Simplification des double consonnes
Suppression des consonnes en derniere lettre
(bon c'est de mémoire tout ca ... y a tioute une serie a faire et dans le bon ordre)
etc etc
Bref toute une series de manip pour transformer un mot en son expression phonetique. Une fois cette routine au point, tu l'appliques a tous tes textes et quand on fait une recherche on recherche le mot phonétisé dans les texte phonetisés ...
Bon y a un peu d'huile de coude pour optimiser mais rien de monstrueux.
Appliqué au cas que tu décris :
Paris --> pari
Parriss --> pari
ou encore :
Bateau --> bato
batteau --> bato
bateaus --> bato
battau -- > bato
barque -> bato (heu non je déconne
). barque devient barc
ai en e
ou en u
y en i
au en o
eau en o
que final en c
qu en c
th en t
dedoublonnage de rr en r tt en t ss en s
Simplification des double consonnes
Suppression des consonnes en derniere lettre
(bon c'est de mémoire tout ca ... y a tioute une serie a faire et dans le bon ordre)
etc etc
Bref toute une series de manip pour transformer un mot en son expression phonetique. Une fois cette routine au point, tu l'appliques a tous tes textes et quand on fait une recherche on recherche le mot phonétisé dans les texte phonetisés ...
Bon y a un peu d'huile de coude pour optimiser mais rien de monstrueux.
Appliqué au cas que tu décris :
Paris --> pari
Parriss --> pari
ou encore :
Bateau --> bato
batteau --> bato
bateaus --> bato
battau -- > bato
barque -> bato (heu non je déconne
13 messages • Page 1 sur 1
Formation recommandée sur ce thème :
Formation Google Analytics : en 2 jours, apprenez comment exploiter l'essentiel des possibilités de l'outil de mesure d'audience de Google. Formation animée par Julien Coquet, expert certifié officiellement par Google Analytics.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Le Full Crawl a enfin commencé
- Début du Full Crawl
- Google rachète Orion, un algorithme inventé par Ori Allon
- Sortie officielle de GoogleStats v2.0 !
- Gestion des langues et des sessions en PHP / MySQL
- Le début du full crawl
- The Technology Behind Google
- Googlebot, le robot d'indexation de Google
- Passage à l'heure d'été/hiver sur un forum phpBB
- GoogleStats : analyse temps réel des visites de Google sur votre site
- Logiciel de référencement AgentWebRanking
AgentWebRanking est un logiciel professionnel qui permet d'analyser le positionnement d'un ou plusieurs sites dans plus de 300 moteurs de recherche dans le monde. Vous pouvez ainsi analyser les performances du référencement pour de nombreux mots-clés. - Transformer des citations en liens
Cet outil vous permet de trouver des pages citant votre site mais ne faisant pas (encore) de lien. Il suffira parfois d'un simple mail pour transformer cette simple citation en lien (backlink).
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités








le forum