bot ou crawler open source çà existe ?

Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics

Tony Montana
WRInaute discret
WRInaute discret
 
Messages: 62
Inscription: Mer Mai 11, 2005 18:52

bot ou crawler open source çà existe ?

Message le Sam Déc 10, 2005 23:14

Je voudrais indexé les pages de mes sites sur un moteur de recherche hébergé par mes soins. Est-ce qu'il existe des solutions open source pour réaliser celà ? J'ai entendu parlé de aspseek mais d'après ce que j'ai lu il faut installer celà sur une machine or je n'ai pas de machine dédié. Il me faudrait un script php, cgi ou perl qui tourne sur du mutualisé. Je précise que j'ai pas besoin de perf, il y a très peu de nouvelles pages créées par jour sur mes sites.


ecocentric
WRInaute accro
WRInaute accro
 
Messages: 3577
Inscription: Mar Fév 10, 2004 16:40

Message le Sam Déc 10, 2005 23:35



ecocentric
WRInaute accro
WRInaute accro
 
Messages: 3577
Inscription: Mar Fév 10, 2004 16:40

Message le Sam Déc 10, 2005 23:37

Il y a aussi plein d'autres scripts comme "Moteur'ed", que j'ai testé et qui a l'air d'aller pas trop mal.
Si ton site est bien indexé, tu peux aussi passer par l'API de Yahoo!.

Tony Montana
WRInaute discret
WRInaute discret
 
Messages: 62
Inscription: Mer Mai 11, 2005 18:52

Message le Dim Déc 11, 2005 12:12

merci :)

franceradio
WRInaute passionné
WRInaute passionné
 
Messages: 667
Inscription: Jeu Avr 19, 2007 18:27

Message le Dim Juil 15, 2007 11:35

Larbin


Larbin est un web crawler (synonyme de (web) robot, spider, scooter, aspirateur...). Il est dimensionné pour ramener une grande quantité de pages web pour remplir la base de données d'un moteur de recherche. A condition d'avoir un réseau suffisament rapide, Larbin est censé être capable de ramener plus de 100 millions de pages sur un PC classique.

Larbin est juste un crawler. Il ne contient aucun outil pour indexer vos données.

Larbin a été initialement développé pour le projet XYLEME de l'équipe VERSO de l'INRIA. Son but était de récupérer toutes les pages xml présentes sur le web pour approvisionner la base de données d'un moteur de recherche tourné vers le xml. Du fait de cette conception, Larbin est très généraliste.


Pandore
WRInaute accro
WRInaute accro
 
Messages: 1427
Inscription: Ven Oct 14, 2005 22:38

Message le Dim Juil 15, 2007 19:13

J'adore le nom donné, Larbin, tout à fait adapté pour ce qu'on lui demande de faire ! lol :lol:


Formation recommandée sur ce thème :

Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités