Recherche une liste ou fichier de mots pour blacklistage

WRInaute discret
Comme tout site communautaire, celui-ci doit parfois faire face à des membres ne respectant pas les chartes d'utilisation.

J'aimerai savoir si où on peut trouver une liste ou des fichiers contenant des mots qui pourraient être facilement repris pour bloquer l'envoie de messages (mots à caractère raciste, sexuel, spam etc.)

Merci par avance pour vos connaissances en la matière.
 
WRInaute accro
pk tu tentes pas de faire ta liste en fonction de TES mots ? sinon ca risque d'etre un peu trop large à mon avis... sur un site chrétien Dan Brown est interdit mais pas sur un forum littéraire :)
 
WRInaute discret
Oui c'est sûr que pour adapter au mieux cette liste, elle devra être complétée par mes propres mots, mais le gros du filtrage concerne les termes en rapport avec le sexe et ces fameux email de cote d'ivoire etc....
Les variantes étant tellement nombreuses, celà est à mon avis quasiement impossible à gérer sans mutualiser ces mots.
Dès lors j'imagine que ce genre de fichier partagés et actualisés sous forme communautaire existent peut être, le tout est de les trouver.
 
WRInaute impliqué
Personnellement, je te déconseillerai un blocage sur une liste de mot standard. Je suis plus pour une modération "humaine", car pris hors de contexte un texte peut prendre n'importe quelle tournure, et une machine n'est à ce jour par encore assez intelligente pour comprendre des phrases :)
 
WRInaute occasionnel
Le problème que tu vas rencontrer, concernera le contexte dans lequel un mot est employé :

Dans un article médical ou sociologique par exemple, tu ne peux pas bannir le mot "sexe", par contre, s'il est utilisé dans le sens pornographique du terme, une censure est envisageable...
 
WRInaute discret
Dans mon cas j'imagine que le mot sexe (à la rigueur les massages à domicile et encore :p) et affilié aura très peu de chance d'être dans le bon contexte :-D

De plus ne nous supprimerons pas les messages contenant les termes en blacklist, ils seront juste placés en file d'attente et devront attendre une validation manuelle pour être envoyé aux autres membres.
Au pire celà entrainera donc un petit retard, pour les faux positifs, de quelques heures pour certains échanges.

Si j'ai rien trouvé d'ici la fin de la semaine je me pencherai peut être sur un début de réalisation de tel fichier ce week-end.
Si ce genre de truc vous intéresse pour vos portails on pourrait peut être faire cà à plusieurs en faisant des fichiers thématiques (sexe - racisme - affaire extraordinaire - scam etc.)

On pourrait ensuite mettre ça sur un serveur public (genre wri :roll: ) et chacun serait libre d'ajouter dans un post temporaire les mots pensant être dans la thématique. Un modérateur après vérification conviendrait ensuite de leur association à la liste officielle...
 
Discussions similaires
Haut