MajesticSEO a découvert + de 1000 milliards de pages web

Consultez la formation sur les stratégies de liens de WebRankInfo / Ranking Metrics


WebRankInfo
Administrateur du site
Administrateur du site
 
Messages: 15905
Inscription: Ven Avr 19, 2002 19:51

MajesticSEO a découvert + de 1000 milliards de pages web

Message le Ven Oct 09, 2009 15:24

Majestic SEO a annoncé avoir découvert 1,026,035,494,521 URL sur le web (et crawlé 127,719,208,045 d'entre elles)
c'est à peu près autant que Google !
rappelons tout de même que MajesticSEO ne récupère pas le texte mais seulement les liens et les anchor text.
Bravo à eux tout de même !!!


druart
WRInaute accro
WRInaute accro
 
Messages: 1701
Inscription: Dim Avr 30, 2006 8:08

Re: MajesticSEO a découvert + de 1000 milliards de pages web

Message le Ven Oct 09, 2009 15:56

C'est effectivement une sacré performance !

Félicitations !

ça me donne l'occasion d'y retourner voir mes résultats tiens ;-)


nervusdm
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 151
Inscription: Sam Jan 05, 2008 22:58

Re: MajesticSEO a découvert + de 1000 milliards de pages web

Message le Lun Oct 12, 2009 13:30

Il est très simple de créer un script qui avale tous les liens d'une page web, puis qui les enregistre dans une table mysql, en allant les visiter.

Je dis très simple, pour m'être amusé à essayer ( avec succès hein ), mêmê si le plus dur est de faire du filtrage sur certains liens.

Après, pour enregistrer 1000 milliards de page, il doit falloir plusieurs serveurs :D ( c'est peu de le dire )


dmathieu
Modérateur
Modérateur
 
Messages: 6929
Inscription: Ven Jan 09, 2004 16:21

Re: MajesticSEO a découvert + de 1000 milliards de pages web

Message le Lun Oct 12, 2009 14:16

@nervusdm pour indexer autant de contenu il ne faut pas seulement plusieurs serveurs. Il faut également une architecture adaptée.
Cela m'étonnerait beaucoup que le crawler de Magestic SEO soit développé en PHP.

Le problème n'est pas la simplicité technique de la chose. C'est d'avoir des outils suffisamment performants pour conserver une application "scalable" et pouvoir indexer de fortes doses de contenu tout en limitant les ressources système.


WebRankInfo
Administrateur du site
Administrateur du site
 
Messages: 15905
Inscription: Ven Avr 19, 2002 19:51

Re: MajesticSEO a découvert + de 1000 milliards de pages web

Message le Lun Oct 12, 2009 14:41

il s'agit d'un crawler distribué qui utilise les machines perso des volontaires qui participent au projet


MagicYoyo
WRInaute accro
WRInaute accro
 
Messages: 2559
Inscription: Lun Mai 24, 2004 15:33

Re: MajesticSEO a découvert + de 1000 milliards de pages web

Message le Lun Oct 12, 2009 14:51

Pour mette un bémol à ce chiffre, j'ai testé la base de Majestic sur un site que je connais... il y avait pas mal d'URL dupliquées avec passage de variables sorties de l'espace, et des images considérées comme des pages.

Sachant aussi qu'ils annoncent connaitre plus de noms de domaines que l'Icann n'en gère... je crois que ces chiffres sont à prendre avec précautions.


WebRankInfo
Administrateur du site
Administrateur du site
 
Messages: 15905
Inscription: Ven Avr 19, 2002 19:51

Re: MajesticSEO a découvert + de 1000 milliards de pages web

Message le Lun Oct 12, 2009 16:19

pour moi cet outil fait partie des meilleurs, notamment de par sa couverture
au sujet des nombres de domaines, aurais-tu des sources à nous donner (pour l'ICANN et pour majesticseo) ?

eric-joomla
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 190
Inscription: Lun Sep 25, 2006 14:42

Re: MajesticSEO a découvert + de 1000 milliards de pages web

Message le Lun Oct 12, 2009 17:09

Même chose qu'Olivier
je trouve que l'outil de majestic seo est pas mal du tout

et surtout independant des moteurs de recherche
ce qui n'est pas la moindre performance


rudddy
WRInaute accro
WRInaute accro
 
Messages: 1744
Inscription: Mer Aoû 01, 2007 19:00

Re: MajesticSEO a découvert + de 1000 milliards de pages web

Message le Lun Oct 12, 2009 19:24

eric-joomla a écrit:et surtout independant des moteurs de recherche

+1


nervusdm
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 151
Inscription: Sam Jan 05, 2008 22:58

Re: MajesticSEO a découvert + de 1000 milliards de pages web

Message le Mar Oct 13, 2009 1:47

@nervusdm pour indexer autant de contenu il ne faut pas seulement plusieurs serveurs. Il faut également une architecture adaptée.
Cela m'étonnerait beaucoup que le crawler de Magestic SEO soit développé en PHP.

Le problème n'est pas la simplicité technique de la chose. C'est d'avoir des outils suffisamment performants pour conserver une application "scalable" et pouvoir indexer de fortes doses de contenu tout en limitant les ressources système.

Qu'importe soit le programme, mais je pense que la base de donnée est sql :p


kanon90
WRInaute passionné
WRInaute passionné
 
Messages: 672
Inscription: Ven Mar 23, 2007 13:36

Re: MajesticSEO a découvert + de 1000 milliards de pages web

Message le Mar Oct 13, 2009 7:58

MagicYoyo a écrit:Pour mette un bémol à ce chiffre, j'ai testé la base de Majestic sur un site que je connais... il y avait pas mal d'URL dupliquées avec passage de variables sorties de l'espace, et des images considérées comme des pages.

Sachant aussi qu'ils annoncent connaitre plus de noms de domaines que l'Icann n'en gère... je crois que ces chiffres sont à prendre avec précautions.


Tous ces chiffres sont à prendre de toute façon avec précaution, maintenant ca reste un outil vraiment intéressant et qui permettent de cerner 2-3 trucs dans la gestion de tes sites.

Aminede92
Nouveau WRInaute
 
Messages: 32
Inscription: Mar Avr 28, 2009 15:17

Re: MajesticSEO a découvert + de 1000 milliards de pages web

Message le Mar Oct 13, 2009 10:08

Bonjour, pouvez vous nous donner une idée sur cet outil ?
merci


WebRankInfo
Administrateur du site
Administrateur du site
 
Messages: 15905
Inscription: Ven Avr 19, 2002 19:51

Re: MajesticSEO a découvert + de 1000 milliards de pages web

Message le Mar Oct 13, 2009 10:20

ça veut dire quoi "une idée" ?
lis http://www.webrankinfo.com/dossiers/outils/historique-backlinks-domaine ça peut t'aider


Formation recommandée sur ce thème :

Formation Netlinking (liens et référencement) : apprenez ce qu'est réellement un bon lien pour le référencement et surtout comment en obtenir. Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 1 invité