Recherche liste d'insultes, d'injures en Français
37 messages
• Page 1 sur 3 • 1, 2, 3
- xibo
- WRInaute discret

- Messages: 51
- Inscription: 21 Oct 2008
Recherche liste d'insultes, d'injures en Français
Bonjour,
Je recherche une liste d'injures, insultes... la plus complète possible pour créer une alerte afin de modérer un forum.
L'idée serai de créer une table injures avec un max d'insultes, lors d'un post un script balaie le post, si il trouve une chaine de caractère équivalente à l'une des chaines de la table > envoi d'un e-mail au modérateur.
Ce genre de script existe t-il déjà ?
Connaissez vous des sites avec liste bien chargées d'insultes ?
Ma crainte c'est que le temps du contrôle face vraiment ramer l'envoi du post ou même planter l'envoi.
Si vous avez des idées sur la question, je suis preneur
Je recherche une liste d'injures, insultes... la plus complète possible pour créer une alerte afin de modérer un forum.
L'idée serai de créer une table injures avec un max d'insultes, lors d'un post un script balaie le post, si il trouve une chaine de caractère équivalente à l'une des chaines de la table > envoi d'un e-mail au modérateur.
Ce genre de script existe t-il déjà ?
Connaissez vous des sites avec liste bien chargées d'insultes ?
Ma crainte c'est que le temps du contrôle face vraiment ramer l'envoi du post ou même planter l'envoi.
Si vous avez des idées sur la question, je suis preneur
-

Marie-Aude - Modérateur

- Messages: 11898
- Inscription: 5 Juin 2006
Re: Recherche liste d'insultes, d'injures en Français
fais une recherche google avec une dizaine d'injures variées précédées de + tu devrais tomber sur ça assez facilement
- j-mi
- WRInaute accro

- Messages: 3411
- Inscription: 17 Mai 2005
Re: Recherche liste d'insultes, d'injures en Français
tu utilise quoi comme site ?
pour limiter les injures faire un stop word dans le quel tu mets lees definitions dans un txt
les modos vous trouvez pas que ce post serait mieux dans la section développer un site web ?
pour limiter les injures faire un stop word dans le quel tu mets lees definitions dans un txt
les modos vous trouvez pas que ce post serait mieux dans la section développer un site web ?
- xibo
- WRInaute discret

- Messages: 51
- Inscription: 21 Oct 2008
Re: Recherche liste d'insultes, d'injures en Français
Merci pour ces 1ers retours mais je me rends compte que c'est beaucoup plus compliqué que ça en a l'air.
Ok pour les stop word dans un txt c'est plus pratique en plus à gérer que dans une table.
Mais la liste risque d'être très longue. J'ai fait quelques recherches j'en suis à déjà plus de 1000 insultes (à trier encore un peu).
Mais il reste plusieurs failles pour lesquelles on peut trouver des contournements.
Les insultes peuvent s'écrire sous différentes formes : (je prends un mot plus que soft pour pas pourrir le forum mais co...d aurait fait l'affaire pour "o".
On peut donc écrire
1> gourde
2> g0urde avec un zéro à la place de o
3> G O U R D E avec des espaces ou tirets....la liste est sympa
4> Kon...rd
...
Pour le point (3) le script peut créer une alerte au modo pour toutes les chaînes qui comportent 3 lettres chacune espacée d'un tiret, =, #,...
Mais pour les points 2 et 4 ça devient de plus en plus compliqué et lourd pour le serveur à gérer.
Techniquement un script ne pourra jamais être fiable à 100% à mon avis...?
Mais on peut nettement compliquer la tache. Une protection à 70% sera toujours plus sûre qu'une protection à 15%...
Merci à ceux qui ont des idées ou l'envie de se triturer les neurones...
Ok pour les stop word dans un txt c'est plus pratique en plus à gérer que dans une table.
Mais la liste risque d'être très longue. J'ai fait quelques recherches j'en suis à déjà plus de 1000 insultes (à trier encore un peu).
Mais il reste plusieurs failles pour lesquelles on peut trouver des contournements.
Les insultes peuvent s'écrire sous différentes formes : (je prends un mot plus que soft pour pas pourrir le forum mais co...d aurait fait l'affaire pour "o".
On peut donc écrire
1> gourde
2> g0urde avec un zéro à la place de o
3> G O U R D E avec des espaces ou tirets....la liste est sympa
4> Kon...rd
...
Pour le point (3) le script peut créer une alerte au modo pour toutes les chaînes qui comportent 3 lettres chacune espacée d'un tiret, =, #,...
Mais pour les points 2 et 4 ça devient de plus en plus compliqué et lourd pour le serveur à gérer.
Techniquement un script ne pourra jamais être fiable à 100% à mon avis...?
Mais on peut nettement compliquer la tache. Une protection à 70% sera toujours plus sûre qu'une protection à 15%...
Merci à ceux qui ont des idées ou l'envie de se triturer les neurones...
-

herveG - Modérateur

- Messages: 9919
- Inscription: 5 Mar 2003
Re: Recherche liste d'insultes, d'injures en Français
Effectivement, il y a toujours des moyens de contourner.
D´un autre coté, un "Merde" ou "con" peut nous échapper, mais si je commence a écrire "M ER DE" ou "c0n" ou "k0nn ard", on ne peut plus dire que c´est de l´inattention mais bien le souhait de détourner le truc. S´en suit alors une remise en place de tes intervenants....voir un bannissement pour celui qui ne veut pas s´y tenir.
D´un autre coté, un "Merde" ou "con" peut nous échapper, mais si je commence a écrire "M ER DE" ou "c0n" ou "k0nn ard", on ne peut plus dire que c´est de l´inattention mais bien le souhait de détourner le truc. S´en suit alors une remise en place de tes intervenants....voir un bannissement pour celui qui ne veut pas s´y tenir.
- xibo
- WRInaute discret

- Messages: 51
- Inscription: 21 Oct 2008
Re: Recherche liste d'insultes, d'injures en Français
Oui c'est sûr on peut toujours fermer le compte ou blacklister l'ip si ça se reproduit.
Mais pour ça il faut que tu es reçu une alerte pour aller vérifier le post. Sinon comment tu sais qu'un tel post est présent sur ton site ? On ne peut pas lire tous les posts d'un forum manuellement, on ne peut pas non plus les modérer avant envoi, sinon l'interactivité du site est morte.
J'en suis vraiment au tout début de la chaine d'exclusion. Comment être alerté quand un message comporte un risque pour éventuellement modérer après lecture humaine du message en question.
Pour les mots espacés comme m er de c'est jouable assez facilement. Il suffit de dupliquer la 1ère liste (propre) des insultes et de générer les combinaisons possibles avec la liste dupliquée de chacun des mots. Pour "anculer" c'est pareil. On duplique une nouvelle fois la liste, on fait tourner un nouveau script dessus :
A >> peut être remplacé par E
E >> A
O >> 0 zéro
à faire sur toutes les lettres de l'alphabet....
Le problème c'est qu'il faut alors refaire tourner le 1er script des espace sur cette nouvelle liste pour détecter "an q lé"
En partant d'une liste originale de 1000 insultes :
dupliquée une fois pour >> les espaces
puis >> les remplacements de lettres
>> les remplacements de lettres avec espace...
tout est faisable, ce ne sont que des données à traiter, mais la liste risque de contenir dans les 100 000 entrées. Le serveur risque de ne pas trop apprécier le contrôle des chaines de caractères au moment du post de l'internaute...
A creuser... mais je pense qu'avoir un outil solide mis en place une bonne fois pour toute sur ce problème pourrait rendre service à un bon nombre d'éditeurs.
Mais pour ça il faut que tu es reçu une alerte pour aller vérifier le post. Sinon comment tu sais qu'un tel post est présent sur ton site ? On ne peut pas lire tous les posts d'un forum manuellement, on ne peut pas non plus les modérer avant envoi, sinon l'interactivité du site est morte.
J'en suis vraiment au tout début de la chaine d'exclusion. Comment être alerté quand un message comporte un risque pour éventuellement modérer après lecture humaine du message en question.
Pour les mots espacés comme m er de c'est jouable assez facilement. Il suffit de dupliquer la 1ère liste (propre) des insultes et de générer les combinaisons possibles avec la liste dupliquée de chacun des mots. Pour "anculer" c'est pareil. On duplique une nouvelle fois la liste, on fait tourner un nouveau script dessus :
A >> peut être remplacé par E
E >> A
O >> 0 zéro
à faire sur toutes les lettres de l'alphabet....
Le problème c'est qu'il faut alors refaire tourner le 1er script des espace sur cette nouvelle liste pour détecter "an q lé"
En partant d'une liste originale de 1000 insultes :
dupliquée une fois pour >> les espaces
puis >> les remplacements de lettres
>> les remplacements de lettres avec espace...
tout est faisable, ce ne sont que des données à traiter, mais la liste risque de contenir dans les 100 000 entrées. Le serveur risque de ne pas trop apprécier le contrôle des chaines de caractères au moment du post de l'internaute...
A creuser... mais je pense qu'avoir un outil solide mis en place une bonne fois pour toute sur ce problème pourrait rendre service à un bon nombre d'éditeurs.
-

herveG - Modérateur

- Messages: 9919
- Inscription: 5 Mar 2003
Re: Recherche liste d'insultes, d'injures en Français
Il te faut un système d´alerte comme sur WRI. Si quelqu un estime que ca insulte de trop, tu seras alors averti et tu peux modérer.
As-tu une équipe de modération qui s´occupe de ton forum ?
As-tu une équipe de modération qui s´occupe de ton forum ?
- lafleur2004
- WRInaute passionné

- Messages: 1651
- Inscription: 8 Avr 2004
Re: Recherche liste d'insultes, d'injures en Français
http://bonbonze.net/v2/insultes/index.php?ord=1
http://www.echolalie.org/wiki/index.php?ListeAlphabetiquedInjures
http://www.echolalie.org/wiki/index.php?ListeDesJuronsDuCapitaineHaddock
http://forum.aufeminin.com/forum/f558/__f2368_f558-Liste-d-injures-pou ... betes.html
http://www.zuneo.net/2005/11/putain-merde.html
Voila voilà
http://www.echolalie.org/wiki/index.php?ListeAlphabetiquedInjures
http://www.echolalie.org/wiki/index.php?ListeDesJuronsDuCapitaineHaddock
http://forum.aufeminin.com/forum/f558/__f2368_f558-Liste-d-injures-pou ... betes.html
http://www.zuneo.net/2005/11/putain-merde.html
Voila voilà
- xibo
- WRInaute discret

- Messages: 51
- Inscription: 21 Oct 2008
Re: Recherche liste d'insultes, d'injures en Français
Merci Lafleur2004 !
J'avais déjà bonbonze et capitaine Haddock mais celle de aufeminin vient complèter toutes ces politesses
Avec l'accord des modérateurs on pourra diffuser la liste complète sur WRI en fin de projet.
Reste à générer les combinaisons, les remplacements de caractères et surtout le script php qui va comparer les chaines de caractères à chaque nouveau post.
J'avais déjà bonbonze et capitaine Haddock mais celle de aufeminin vient complèter toutes ces politesses
Avec l'accord des modérateurs on pourra diffuser la liste complète sur WRI en fin de projet.
Reste à générer les combinaisons, les remplacements de caractères et surtout le script php qui va comparer les chaines de caractères à chaque nouveau post.
-

skyll - WRInaute passionné

- Messages: 1364
- Inscription: 14 Oct 2005
Re: Recherche liste d'insultes, d'injures en Français
xibo a écrit:1>gourde
2> g0urde avec un zéro à la place de o
3> G O U R D E avec des espaces ou tirets....la liste est sympa
...
de plus, gourde peut aussi etre un truc pratique avec lequel on se désaltère...
si plus personne ne peut écrire gourde, ca peut limiter un peu les discutions, car pas mal de mots usuels
sont utilisés dans pas mal "d'insultes" (cf Nez de boeuf etc...)
-

herveG - Modérateur

- Messages: 9919
- Inscription: 5 Mar 2003
Re: Recherche liste d'insultes, d'injures en Français
Exact et puis il y a ca aussi :
Autant sur un forum, ca ne me gêne pas de voir : "ah je suis con, j´ai oublié de faire ca" par contre : "t´es vraiment un gros con toi" n´a pas sa place sur un forum...
Autant sur un forum, ca ne me gêne pas de voir : "ah je suis con, j´ai oublié de faire ca" par contre : "t´es vraiment un gros con toi" n´a pas sa place sur un forum...
- xibo
- WRInaute discret

- Messages: 51
- Inscription: 21 Oct 2008
Re: Recherche liste d'insultes, d'injures en Français
Tout à fait d'accord avec herveG et skyll, mais l'objectif n'est pas d'effectuer un remplacement de mot comme on le voit sur certains forums "c'est un c**" Je trouve ça débile, on comprend parfaitement l'insulte, totalement inutile.
L'objectif est d'envoyer tous les messages comportant un risque au modérateur. Plutôt que de devoir surveiller tous les posts, ce qui peut être fait en parallèle un fois par mois, c'est surtout de gérer les priorité en étant avertit dans une interface privée, des messages qui pourraient comporter un risque.
On facilite alors le travail des modérateurs, c'est une sorte d'assurance sur le contrôle des contenus.
Ce script peut ensuite être utilisé pour les commentaires sur les blogs ou tout autre contenu venant de l'extérieur. On n'a plus qu'à l'appliquer aux différents formulaires de post sur un site.
Par la suite on peut ajouter dans la liste des mots en surveillance l'url d'un concurrent qui spam les commentaires ou forum...
L'outil s'enrichit avec le temps en complétant le .txt appelé
Je suis certain qu'il a un truc à monter. Ce qui m'étonne c'est que visiblement rien ne soit déjà fait de complet à se sujet.
On a des antivirus qui se mettent à jour continuellement, on pourrait traiter ce problème comme on traite les virus.
L'objectif est d'envoyer tous les messages comportant un risque au modérateur. Plutôt que de devoir surveiller tous les posts, ce qui peut être fait en parallèle un fois par mois, c'est surtout de gérer les priorité en étant avertit dans une interface privée, des messages qui pourraient comporter un risque.
On facilite alors le travail des modérateurs, c'est une sorte d'assurance sur le contrôle des contenus.
Ce script peut ensuite être utilisé pour les commentaires sur les blogs ou tout autre contenu venant de l'extérieur. On n'a plus qu'à l'appliquer aux différents formulaires de post sur un site.
Par la suite on peut ajouter dans la liste des mots en surveillance l'url d'un concurrent qui spam les commentaires ou forum...
L'outil s'enrichit avec le temps en complétant le .txt appelé
Je suis certain qu'il a un truc à monter. Ce qui m'étonne c'est que visiblement rien ne soit déjà fait de complet à se sujet.
On a des antivirus qui se mettent à jour continuellement, on pourrait traiter ce problème comme on traite les virus.
-

skyll - WRInaute passionné

- Messages: 1364
- Inscription: 14 Oct 2005
Re: Recherche liste d'insultes, d'injures en Français
xibo a écrit:Je suis certain qu'il a un truc à monter. Ce qui m'étonne c'est que visiblement rien ne soit déjà fait de complet à se sujet. On a des antivirus qui se mettent à jour continuellement, on pourrait traiter ce problème comme on traite les virus.
Je suis pas certain.... il y à beacoup trop de cas particuliers à traiter. (cf la démo d'Hervé)
à mon humble avis, seul un humain seras capable de démeler un mot utilisé comme insulte du même mot utilisé à une autre fin...
pour pouvoir y arriver, vlà l'algo sémantique à mettre en place
-

herveG - Modérateur

- Messages: 9919
- Inscription: 5 Mar 2003
Re: Recherche liste d'insultes, d'injures en Français
Et puis au delà de la "prouesse" technique nécessaire à mettre en place un tel appareil, il se pose la question de l´utilité. Si ton forum démarre, alors ça ne vaut pas le coup de monter une usine à gaz pour si peu. A contrario, si tu as un gros forum, tu vas être bombardé de signalement. Vas-tu vraiment prendre le temps d´éditer tous les messages ? Tu seras déjà bien occupé avec les autres "problèmes de modération" (spam, diffamation, etc.). Au bout d´un moment, tu es même obligé d´avoir une équipe de modérateurs (comme ici) qui veillent au grain.
Mon avis personnel est que mise à part le challenge technique à vouloir mettre un truc comme ça en place, l´utilité ne me parait pas valoir l´énergie et le temps à développer un tel truc.
Mon avis personnel est que mise à part le challenge technique à vouloir mettre un truc comme ça en place, l´utilité ne me parait pas valoir l´énergie et le temps à développer un tel truc.
37 messages
• Page 1 sur 3 • 1, 2, 3
Lectures recommandées sur ce thème :
- chercher les injures
- Liste des stop words en français
- Liste des blogs Google Français ?
- Régies publicitaires et insultes
- Recherche moteurs de recherche des pays ou on parle francais
- Liste des régies aux clics texte francais.
- Balancez moi vos meilleures insultes
- Insultes à mon nom sur un site que faire
- Recherche en français.
- Liste de mots "vides" français pour les moteurs de
- Le blog officiel de Google AdWords en français - Inside AdWords FR - 11-04-2008
- 1ère faille de sécurité découverte sur Google Chrome - 03-09-2008
- Référencement de sites multilingues - 22-04-2004
- Référencer un site multilingue - 24-04-2004
- Vidéos de Matt Cutts sur le référencement Google - 04-08-2006
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 1 invité
