Ou commencer l'indexation du web ? :)

Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics


Twister
WRInaute passionné
WRInaute passionné
 
Messages: 619
Inscription: Ven Jan 16, 2004 14:37

Ou commencer l'indexation du web ? :)

Message le Sam Jan 28, 2006 18:21

Salut,
dans le cadre des TIPE ( la même chose que les TPE pour les lycéens),
je crée un petit moteur de recherche, et je me pose une question bête : où commencer l'indexation ?
Sachant que mon moteur n'est fait que pour en étudier le fonctionnement,
il n'indexera donc pas beaucoup de pages.
J'aimerais que ce soit des pages en français et sur tous les sujets.

Si vous avez des idées...
:)


phloam
WRInaute accro
WRInaute accro
 
Messages: 1369
Inscription: Ven Avr 08, 2005 22:06

Message le Sam Jan 28, 2006 18:53

Moi j'ai une idée: Lache la bête sur Webrankinfo. :-)


Twister
WRInaute passionné
WRInaute passionné
 
Messages: 619
Inscription: Ven Jan 16, 2004 14:37

Message le Sam Jan 28, 2006 19:02

Ouais mais avec le nombre de pages qu'il y a, il va s'exciter sur le forum pour indexer uniquement des pages sur le référencement, ce qui serait bien, ce serait d'avoir plusieurs sujets.

J'avais pensé à Wikipédia peut-être.


aladdin
WRInaute passionné
WRInaute passionné
 
Messages: 925
Inscription: Ven Avr 29, 2005 12:26

Message le Sam Jan 28, 2006 19:07

les crawlers ont deux sources principales pour les liens à indexer :

1 - Les liens soumis à la main : tu met des liens manuellement dans un fichier ou dans une base que ton crawler utilisera
2 - L'apprentissage : au fur et à mesure que ton crawler vas indexer des pages, il vas trouver d'autres liens qu'il vas ajouter à sa base...etc


il ny'a rien de magique là dedans, un moteur ne peut pas "deviner" des url ;)


Twister
WRInaute passionné
WRInaute passionné
 
Messages: 619
Inscription: Ven Jan 16, 2004 14:37

Message le Sam Jan 28, 2006 19:10

aladdin a écrit:il ny'a rien de magique là dedans, un moteur ne peut pas "deviner" des url ;)

Je sais bien,
mon moteur suivra les urls qu'il trouvera dans les sites.
Ma question est : par quelle page commencer ?

amazigh25
WRInaute passionné
WRInaute passionné
 
Messages: 996
Inscription: Sam Juin 04, 2005 12:53

Message le Sam Jan 28, 2006 19:14

Salut

Lache le sur Dmoz au moins tu es sur d'avoir des sites de qualités :roll:

@+

Adam


cybervince
WRInaute passionné
WRInaute passionné
 
Messages: 872
Inscription: Dim Aoû 01, 2004 0:08

Message le Sam Jan 28, 2006 21:08

Sur un annuaire généraliste comme Dmoz en effet ca peut être une bonne idée.
Ou alors au pire des cas, lache le chez moi ^^


wullon
WRInaute accro
WRInaute accro
 
Messages: 3914
Inscription: Sam Sep 18, 2004 15:06

Message le Sam Jan 28, 2006 21:33

dmoz :)

Luj
WRInaute impliqué
WRInaute impliqué
 
Messages: 352
Inscription: Dim Juil 17, 2005 10:53

Message le Sam Jan 28, 2006 22:01

Google News peut être intéressant.


Twister
WRInaute passionné
WRInaute passionné
 
Messages: 619
Inscription: Ven Jan 16, 2004 14:37

Message le Sam Jan 28, 2006 22:52

C'est vrai que google news peut être une bonne idée, je vais ptêtre commencer par là.
Dur de choisir entre google news et Dmoz, Dmoz me donnerait surement plus de diversité.

Merci pour vos suggestion :D

bob154
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 219
Inscription: Dim Déc 04, 2005 0:38

Message le Dim Jan 29, 2006 0:10

Dmoz c'est tres représentatif du web :wink:

amazigh25
WRInaute passionné
WRInaute passionné
 
Messages: 996
Inscription: Sam Juin 04, 2005 12:53

Message le Dim Jan 29, 2006 0:49

Bonsoir
Effectivement Dmoz contient des sites perso comme des sites pro contrairement à Google News qui ne contient que des gros en grande partie.

@+

pene-r
WRInaute accro
WRInaute accro
 
Messages: 1169
Inscription: Mer Jan 12, 2005 9:26

Message le Dim Jan 29, 2006 9:50

par là
http://www.la-fin.c.la/
:P
ok, j'ai compris :arrow:


Formation recommandée sur ce thème :

Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :

  • Ancienneté d'un site dans Google
    Cet outil vous permet de connaître une estimation de l'ancienneté d'un site : il fournit la date à laquelle Google l'a indexé la première fois (et la même chose pour archive.org).
  • Les sous-domaines d'un site
    Cet outil vous permet de trouver la liste des sous-domaines (indexés) d'un site.
  • La classe C de l'adresse IP
    Cet outil vous permet de vérifier si plusieurs sites sont hébergés sur la même classe C (adresse IP du serveur).


Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités