Liste de mots "vides" français pour les moteurs de

Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics


ltressens
WRInaute passionné
WRInaute passionné
 
Messages: 551
Inscription: Ven Avr 02, 2004 14:52

Liste de mots "vides" français pour les moteurs de

Message le Mer Juil 26, 2006 13:02

[edit]... recherche (pkoi le forum a coupé le titre que j'avais réussi à taper en entier ???)[/Edit]

Salut forum !

Connaissez vous ou possédez vous une liste des mots francais considérés comme "vides" ou "pollution" pour une recherche :
de, des, le, la, les, sur, dans, etc...

M'ci !


siddhy
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 163
Inscription: Lun Sep 20, 2004 15:50

Message le Mer Juil 26, 2006 13:36

Voilà une liste non exhaustive de mots "vides".
(j'ai pris comme base le moteur HTdig)
Code: Tout sélectionner
-elle
-il
10ème
1er
1ère
2ème
3ème
4ème
5ème
6ème
7ème
8ème
9ème
a
afin
ai
ainsi
ais
ait
alors
après
as
assez
au
aucun
aucune
auprès
auquel
auquelles
auquels
auraient
aurais
aurait
aurez
auriez
aurions
aurons
auront
aussi
aussitôt
autre
autres
aux
avaient
avais
avait
avant
avec
avez
aviez
avoir
avons
ayant
beaucoup
c'
car
ce
ceci
cela
celle
celles
celui
cependant
certes
ces
cet
cette
ceux
chacun
chacune
chaque
chez
cinq
comme
d'
d'abord
dans
de
dehors
delà
depuis
des
dessous
dessus
deux
deça
dix
doit
donc
dont
du
durant
dès
déjà
elle
elles
en
encore
enfin
entre
er
est
est-ce
et
etc
eu
eurent
eut
faut
fur
hormis
hors
huit
il
ils
j'
je
jusqu'
l'
la
laquelle
le
lequel
les
lesquels
leur
leurs
lors
lorsque
lui

m'
mais
malgré
me
melle
mes
mm
mme
moi
moins
mon
mr
même
mêmes
n'
neuf
ni
non-
nos
notamment
notre
nous
néanmoins
nôtres
on
ont
ou

par
parce
parfois
parmi
partout
pas
pendant
peu
peut
peut-être
plus
plutôt
pour
pourquoi
près
puisqu'
puisque
qu'
quand
quant
quatre
que
quel
quelle
quelles
quelqu'
quelque
quelquefois
quelques
quels
qui
quoi
quot
s'
sa
sans
se
sept
sera
serai
seraient
serais
serait
seras
serez
seriez
serions
serons
seront
ses
si
sien
siennes
siens
sitôt
six
soi
sommes
son
sont
sous
souvent
suis
sur
t'
toi
ton
toujours
tous
tout
toutefois
toutes
troiw
tu
un
une
unes
uns
voici
voilà
vos
votre
vous
vôtres
y
à
ème
étaient
étais
était
étant
étiez
étions
êtes
être
afin
ainsi
alors
après
aucun
aucune
auprès
auquel
aussi
autant
aux
avec
car
ceci
cela
celle
celles
celui
cependant
ces
cet
cette
ceux
chacun
chacune
chaque
chez
comme
comment
dans
des
donc
donné
dont
duquel
dès
déjà
elle
elles
encore
entre
étant
etc
été
eux
furent
grâce
hors
ici
ils
jusqu
les
leur
leurs
lors
lui
mais
malgré
mes
mien
mienne
miennes
miens
moins
moment
mon
même
mêmes
non
nos
notre
notres
nous
notre
oui
par
parce
parmi
plus
pour
près
puis
puisque
quand
quant
que
quel
quelle
quelque
quelquun
quelques
quels
qui
quoi
sans
sauf
selon
ses
sien
sienne
siennes
siens
soi
soit
sont
sous
suis
sur
tandis
tant
tes
tienne
tiennes
tiens
toi
ton
tous
tout
toute
toutes
trop
très
une
vos
votre
vous
étaient
était
étant
être


ltressens
WRInaute passionné
WRInaute passionné
 
Messages: 551
Inscription: Ven Avr 02, 2004 14:52

Message le Mer Juil 26, 2006 13:52

Merci bien !


Borower
WRInaute accro
WRInaute accro
 
Messages: 2151
Inscription: Lun Avr 18, 2005 20:58

Message le Mer Juil 26, 2006 13:56

Tres interessant pour enlever tout ces mots 'vides' pour les jolies URL automatique.
Merci beaucoup

Amaryllid
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 165
Inscription: Ven Avr 08, 2005 23:03

Message le Mer Juil 26, 2006 15:15

Une telle liste ressemble à un "antidictionnaire" ou encore "stoplist". Peut-être en trouve t-on sur le web.


cprail
WRInaute accro
WRInaute accro
 
Messages: 1564
Inscription: Dim Mar 05, 2006 20:09

Message le Mer Juil 26, 2006 16:02

et la même en anglais ça existe?


siddhy
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 163
Inscription: Lun Sep 20, 2004 15:50

Message le Mer Juil 26, 2006 16:54

Ce n'est pas exactement la même, mais il y a déjà quelques mots ...
Code: Tout sélectionner
a

ago

all

almost

along

also

am

an

and

answer

any

anybody

anywhere

are

aren't

around

ask

bad

been

being

best

better

big

but

by

can

can't

come

could

couldn't

did

didn't

do

does

don't

each

either

even

ever

every

everybody

everyone

far

found

go

going

gone

good

got

had

has

have

haven't

having

her

here

hers

him

his

how

into

isn't

its

know

like

little

many

me

more

most

must

my

new

news

no

none

not

nothing

of

off

often

old

on

once

or

our

ours

out

over

please

rather

she

should

so

some

something

sometime

somewhere

than

thank

that

the

their

theirs

them

then

there

these

they

this

those

thus

to

too

untrue

up

upon

use

very

via

want

was

way

were

what

when

where

which

who

whom

whose

why

will

worse

worst

would

yes

yet

you

your

yours

how


cprail
WRInaute accro
WRInaute accro
 
Messages: 1564
Inscription: Dim Mar 05, 2006 20:09

Message le Mer Juil 26, 2006 18:50

C'est vrai que la logique du moteur anglophone est differente et plus complexe sur la signifiance des mots... mais merci, c'est toujours pratique!

yanhl
WRInaute passionné
WRInaute passionné
 
Messages: 793
Inscription: Jeu Déc 04, 2003 12:11

Message le Mer Juil 26, 2006 21:55

Il y a aussi le search_stopwords.txt de phpbb (language/lang_english) qui contient une bonne liste.
Je ne la reproduis pas ici, phpbb étant libre... http://www.phpbb.com

Les autres forums comportent certainement une liste similaire, les CMS également. Ca peut être une bonne piste, et il doit même y avoir les fonctions pour appliquer le filtre, ce qui n'est pas forcément trivial pour les langues dont les mots peuvent comprendre des accents (que les internautes ne tapent pas toujours, bien sûr).

J'avais également vu quelqu'un qui allait jusqu'à exclure les mots comprenant trop de fois la même lettre afin d'exclure les expressions type "yeeeeeaaaaaah", "ah ouaaaaaaaiiiis !", etc.


doic
WRInaute accro
WRInaute accro
 
Messages: 1124
Inscription: Ven Nov 07, 2003 17:33

Message le Mer Juil 26, 2006 22:32

Gooooooooooooooooooooooooooooooooooooooooooooooooooogle !


Malaiac
WRInaute impliqué
WRInaute impliqué
 
Messages: 357
Inscription: Mer Mai 04, 2005 21:42

Message le Jeu Juil 27, 2006 0:40

Google est ton ami.
http://www.google.com/search?client=ope ... 8&oe=utf-8

On trouve de tout, ensuite il faut raffiner.
Sur Zewol, j'utilise une stop words list de 800 mots, une cinquantaine de mots interdits (sexe et le toutim), et je travaille sur les expressions liées.

NOTE MODO : la réponse rapide a l'air de planter... quand je répond rapide, je suis renvoyé vers un autre post et ma réponse n'apparait nulle part.

pounk
WRInaute passionné
WRInaute passionné
 
Messages: 893
Inscription: Sam Fév 21, 2004 14:31

Message le Jeu Juil 27, 2006 0:55

http://www.unine.ch/info/clef un site sympa qui propose des stop word list dans quinze langues et pour ces même langue une listes des mots les plus fréquents

istreen
 

Message le Jeu Juil 27, 2006 9:17

Quel interet de ces listes ?


cprail
WRInaute accro
WRInaute accro
 
Messages: 1564
Inscription: Dim Mar 05, 2006 20:09

Message le Jeu Juil 27, 2006 9:47

exemple ne pas utiliser "de la grâce hors d'ici" pour un titre de page web :P

istreen
 

Message le Jeu Juil 27, 2006 9:50

intéréssant je met ce post en favoris lol

Liste de mots "vides" français pour les moteurs de

Formation recommandée sur ce thème :

Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :

Consultez la description détaillée des produits ou services de Google suivants : Google Sets, Google Suggest

  • Tester le type de redirection
    Cet outil vous permet de tester la validité d'un lien pour le référencement. Il vous indique la nature du lien (lien en dur, redirection bien gérée par les moteurs ou redirection mal gérée par les moteurs).
  • Générateur de mots-clés
    Cet outil vous permet de créer à partir de quelques mots-clés une liste d'expressions constituées des mots pris dans tous les ordres possibles. Il sert aux analyses de positionnement et achats de mots-clés.


Qui est en ligne

Utilisateurs parcourant ce forum: tryan et 0 invités