bot ou crawler open source çà existe ?
6 messages • Page 1 sur 1
Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics
- Tony Montana
- WRInaute discret

- Messages: 62
- Inscription: Mer Mai 11, 2005 18:52
bot ou crawler open source çà existe ?
Je voudrais indexé les pages de mes sites sur un moteur de recherche hébergé par mes soins. Est-ce qu'il existe des solutions open source pour réaliser celà ? J'ai entendu parlé de aspseek mais d'après ce que j'ai lu il faut installer celà sur une machine or je n'ai pas de machine dédié. Il me faudrait un script php, cgi ou perl qui tourne sur du mutualisé. Je précise que j'ai pas besoin de perf, il y a très peu de nouvelles pages créées par jour sur mes sites.
-

ecocentric - WRInaute accro

- Messages: 3577
- Inscription: Mar Fév 10, 2004 16:40
Voir liste ici :
http://helioss.logiciellibre.net/annuai ... he-092.php
http://helioss.logiciellibre.net/annuai ... he-092.php
-

ecocentric - WRInaute accro

- Messages: 3577
- Inscription: Mar Fév 10, 2004 16:40
Il y a aussi plein d'autres scripts comme "Moteur'ed", que j'ai testé et qui a l'air d'aller pas trop mal.
Si ton site est bien indexé, tu peux aussi passer par l'API de Yahoo!.
Si ton site est bien indexé, tu peux aussi passer par l'API de Yahoo!.
- franceradio
- WRInaute passionné

- Messages: 667
- Inscription: Jeu Avr 19, 2007 18:27
Larbin
Larbin est un web crawler (synonyme de (web) robot, spider, scooter, aspirateur...). Il est dimensionné pour ramener une grande quantité de pages web pour remplir la base de données d'un moteur de recherche. A condition d'avoir un réseau suffisament rapide, Larbin est censé être capable de ramener plus de 100 millions de pages sur un PC classique.
Larbin est juste un crawler. Il ne contient aucun outil pour indexer vos données.
Larbin a été initialement développé pour le projet XYLEME de l'équipe VERSO de l'INRIA. Son but était de récupérer toutes les pages xml présentes sur le web pour approvisionner la base de données d'un moteur de recherche tourné vers le xml. Du fait de cette conception, Larbin est très généraliste.
Larbin est un web crawler (synonyme de (web) robot, spider, scooter, aspirateur...). Il est dimensionné pour ramener une grande quantité de pages web pour remplir la base de données d'un moteur de recherche. A condition d'avoir un réseau suffisament rapide, Larbin est censé être capable de ramener plus de 100 millions de pages sur un PC classique.
Larbin est juste un crawler. Il ne contient aucun outil pour indexer vos données.
Larbin a été initialement développé pour le projet XYLEME de l'équipe VERSO de l'INRIA. Son but était de récupérer toutes les pages xml présentes sur le web pour approvisionner la base de données d'un moteur de recherche tourné vers le xml. Du fait de cette conception, Larbin est très généraliste.
6 messages • Page 1 sur 1
Formation recommandée sur ce thème :
Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Blog de Google sur l'Open Source
- Etude de Googlebot, le robot crawler de Google (Fresh Bot, Deep Bot)
- Google crawle les fichiers CSS
- Google Web Toolkit, pour créer des applications en AJAX
- Hébergement de projets open source sur Google Code
- Yahoo Slurp et autres robots d'indexation de Yahoo
- Googlebot, le robot d'indexation de Google
- Google passe le cap des 3 milliards de pages
- Open Federation : Google Talk joue la carte de l'interopérabilité avec XMPP
- Ajouter un Gadget Google sur son site
- enfin le code source du vista publié, bientot en open source
- [Google] Code source d'Androïd devient Open Source
- [Robotstats] un bot nommé Crawler
- Open source database
- logiciel open source XML
- Un éditeur RSS open source
- Mambo Open Source + Réferencement
- participez à un projet open source
- Plateforme de blogs open source
- Outils de référencement open source
- outils de stats open source
- Solution de bug tracking open source ?
- Comparaison d'outils statistiques open-source !
- APIs sociales open source de Google
- Open source site petites annonces
Consultez la description détaillée des produits ou services de Google suivants : Google Code : Open Source Projects, Google Web Toolkit, Google Code Project Hosting, Google Code
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités

le forum