Caractères génériques sur Google : Résultats surprenants

Nouveau WRInaute
Une recherche avec "**" ou "*,*" (sans les guillemets) renvoie
4 210 000 000 pages. Initialement, je faisais juste un petit test pour voir comment il réagissait sur des caractères génériques (recherche façon MSDOS : "*.*" ).

Cela m'amène à trois questions :

Comment cela est il interprêté coté serveur ? (j'avoue, je ne connais rien en UNIX)

Quelqu'un qui voudrait créer son propre moteur de recherche ne pourrait-il pas s'appuyer sur ce genre de requêtes, avec un robot, pour récupérer en toute simplicité le même index que GG ?

S'il s'agit d'une erreur de protection de la zone de texte, est-ce que cela peut vouloir dire qu'en finalité il s'agit bien du nombre de page réel indexé par GG ? (après tout je ne sais pas comment vérifier qu'ils indexent bien 8 168 684 336 pages comme ils l'annoncent à ce jour en page d'accueil).

Nota : Sur YAHOO, on arrive à des résultats du même ordre avec des requêtes type "*a" (toujours sans guillemets) pour 10 600 000 000 pages 8O
 
WRInaute discret
Ce qui est affiché n'est qu'une approximation !

Quelqu'un qui voudrait créer son propre moteur de recherche ne pourrait-il pas s'appuyer sur ce genre de requêtes, avec un robot, pour récupérer en toute simplicité le même index que GG ?

Non, google n'affiche pas toutes les pages
 
Nouveau WRInaute
chmouc a dit:
Ce qui est affiché n'est qu'une approximation !

...


Non, google n'affiche pas toutes les pages

Certes, mais 10 600 000 000 pages + 4 210 000 000 pages, ce serait tout de même pas négligeable (je vois venir les matheux qui manqueront pas de me rappeler qu'il faut déduire de cette somme l'intersection des deux ensembles. Je conviens que j'ai fait un raccourci).
Vu que tu réponds à une des trois questions, je la précise, et elle sera en deux volets :
Créer le robot logiciel qui scruterait les résultats sur ce type de requêtes vous semble-t-il simple à réaliser ?
Et est-ce que ce n'est pas une partie (petite et réductrice) des fonds de commerce GG et YAHOO qui serait là en libre service ?

En somme, est-ce que ce n'est en rien dérangeant pour ces moteurs, ou bien est-ce qu'il s'agit d'une erreur, d'un oubli, qui pourraient être exploitables ?
 
WRInaute discret
Comme je le répéte, "Non, google n'affiche pas toutes les pages"

Créer le robot logiciel qui scruterait les résultats sur ce type de requêtes vous semble-t-il simple à réaliser ?
Oui si on aurait eu accès aux résultats

Pour ta requête -https://www.google.fr/search?q=*.*&hl=fr&lr=&start=860&sa=N

On peut pas aller plus loin que la page 87 !
 
Nouveau WRInaute
chmouc a dit:
Comme je le répéte, "Non, google n'affiche pas toutes les pages"

:? Désolé, je croyais que tu me disais que les 4 210 000 000 pages ne représentaient pas l'intégralité de l'index GG. Bravo d'avoir osé explorer jusqu'à la page 87, ça répond mieux à ma question :wink:

chmouc a dit:
Oui si on aurait eu accès aux résultats
Si j'aurais su j'aurais pas venu.

Merci ! Je vais pousser les essais sur Yahoo de ce pas !

:arrow:
 
WRInaute occasionnel
ben vous pouvez demander à google d'aficher 100 résultats à la fois (voir préférences ou ajoutez &num=100 dans l'url de recherche)
 
Nouveau WRInaute
Résultats :

Google : première recherche : 862 pages
En incluant les pages ignorées : 680 pages :?:
(merci nodom, ta manip m'a fait gagner un temps sympatique :wink: )

Yahoo : première recherche : 1000 pages
En incluant les pages ignorées : 1000 pages
 
Discussions similaires
Haut