Mais comment font ces méta moteurs pour alimenter leur base
4 messages • Page 1 sur 1
Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics
Mais comment font ces méta moteurs pour alimenter leur base
Bonjour à tous, j'espère que ma question correspond bien à la bonne catégorie
Alors voilà, j'ai développé récemment un méta moteur (http://www.megadownload.fr) en m'inspirant de deux moteurs de recherche http://rapidlibrary.com et http://4megaupload.com qui sont 2 moteurs pour des célèbres hébergeurs de fichiers.
Techniquement, j'ai pu me débrouiller à peu près, et je ne suis pas mécontent du résultat. Mais reste une énigme, qui me turlupine depuis peu. C'est la question de l'alimentation de la base. Ces 2 moteurs voient leur base grandir chaque jour à une vitesse folle. Et j'ai beau réfléchir, je ne vois pas vraiment comment ils font.
Quelqu'un aurait-il une idée sur le comment de la chose?
Merci.
Alors voilà, j'ai développé récemment un méta moteur (http://www.megadownload.fr) en m'inspirant de deux moteurs de recherche http://rapidlibrary.com et http://4megaupload.com qui sont 2 moteurs pour des célèbres hébergeurs de fichiers.
Techniquement, j'ai pu me débrouiller à peu près, et je ne suis pas mécontent du résultat. Mais reste une énigme, qui me turlupine depuis peu. C'est la question de l'alimentation de la base. Ces 2 moteurs voient leur base grandir chaque jour à une vitesse folle. Et j'ai beau réfléchir, je ne vois pas vraiment comment ils font.
Quelqu'un aurait-il une idée sur le comment de la chose?
Merci.
Dernière édition par welcominh le Mer Nov 19, 2008 18:41, édité 1 fois.
http://www.google.com/support/webmaster ... swer=35769
Je ne donne pas chers de ton site
De plus, faire indexer des pages qui ne retournent aucun résultat est également très mauvais pour toi.
Et c'est pas interdit un site comme le tien ? Proposer du contenu sous licence me semble tout de même risqué ...
Utilisez le fichier robots.txt pour éviter l'exploration des pages de résultats de recherche ou d'autres pages générées automatiquement par les moteurs de recherche et qui n'offrent pas d'intérêt particulier pour les internautes.
Je ne donne pas chers de ton site
De plus, faire indexer des pages qui ne retournent aucun résultat est également très mauvais pour toi.
Et c'est pas interdit un site comme le tien ? Proposer du contenu sous licence me semble tout de même risqué ...
Merci pour le conseil pour l'indexation des derniers résultats. Je ne connaissais pas ce point. J'ai corrigé ca dans le robots.txt.
Pour l'éternel question interdit/pas interdit, j'ai lu sur un autre topic du même genre que ca ne l'était pas en soi (car il s'agit de ce que propose le site et non ce que recherchent les internautes, en gros pareil que la légalité du P2P quoi). Mais ce n'est pas le débat.
Une idée sur le pourquoi du comment sinon?
Je viens de lire sur un forum, qu'apparemment ces sites utilisent des programmes qui tournent 24h/24. Pas étonnant donc soit-disant qu'ils "feedent" leur base chaque jour.
Pour l'éternel question interdit/pas interdit, j'ai lu sur un autre topic du même genre que ca ne l'était pas en soi (car il s'agit de ce que propose le site et non ce que recherchent les internautes, en gros pareil que la légalité du P2P quoi). Mais ce n'est pas le débat.
Une idée sur le pourquoi du comment sinon?
Je viens de lire sur un forum, qu'apparemment ces sites utilisent des programmes qui tournent 24h/24. Pas étonnant donc soit-disant qu'ils "feedent" leur base chaque jour.
4 messages • Page 1 sur 1
Formation recommandée sur ce thème :
Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Baromètre moteurs de recherche Décembre 2004
- Baromètre moteurs de recherche Février 2005
- Baromètre moteurs de recherche Janvier 2005
- Importer tout son blog dans Google Base
- Deux nouveaux blogs officiels : Google Talk et Google Base
- Parts de marché des moteurs au Royaume Uni (UK) en Juin 2008
- Historique des Google Dance
Consultez la description détaillée des produits ou services de Google suivants : Google TrustRank
- Test de lien (type de redirection)
Cet outil vous permet de tester la validité d'un lien pour le référencement. Il vous indique la nature du lien (lien en dur, redirection bien gérée par les moteurs ou redirection mal gérée par les moteurs). - Suggestion de mots-clés Google
Cet outil vous permet d'obtenir une liste de 10 mots ou expressions suggérés par Google sur la base d'un mot que vous fournissez. - Partenaires pour échanges de liens
Cet outil vous liste quelques sites qui font des liens vers des sites similaires au vôtre, pour vous aider à trouver des partenaires pour des échanges de liens.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités




le forum