Caractères génériques sur Google : Résultats surprenants
8 messages • Page 1 sur 1
Consultez la formation à Google Analytics de WebRankInfo / Ranking Metrics
-

grandmaitrezen - WRInaute discret

- Messages: 71
- Inscription: Mer Aoû 04, 2004 15:51
Caractères génériques sur Google : Résultats surprenants
Une recherche avec "**" ou "*,*" (sans les guillemets) renvoie
4 210 000 000 pages. Initialement, je faisais juste un petit test pour voir comment il réagissait sur des caractères génériques (recherche façon MSDOS : "*.*" ).
Cela m'amène à trois questions :
Comment cela est il interprêté coté serveur ? (j'avoue, je ne connais rien en UNIX)
Quelqu'un qui voudrait créer son propre moteur de recherche ne pourrait-il pas s'appuyer sur ce genre de requêtes, avec un robot, pour récupérer en toute simplicité le même index que GG ?
S'il s'agit d'une erreur de protection de la zone de texte, est-ce que cela peut vouloir dire qu'en finalité il s'agit bien du nombre de page réel indexé par GG ? (après tout je ne sais pas comment vérifier qu'ils indexent bien 8 168 684 336 pages comme ils l'annoncent à ce jour en page d'accueil).
Nota : Sur YAHOO, on arrive à des résultats du même ordre avec des requêtes type "*a" (toujours sans guillemets) pour 10 600 000 000 pages
4 210 000 000 pages. Initialement, je faisais juste un petit test pour voir comment il réagissait sur des caractères génériques (recherche façon MSDOS : "*.*" ).
Cela m'amène à trois questions :
Comment cela est il interprêté coté serveur ? (j'avoue, je ne connais rien en UNIX)
Quelqu'un qui voudrait créer son propre moteur de recherche ne pourrait-il pas s'appuyer sur ce genre de requêtes, avec un robot, pour récupérer en toute simplicité le même index que GG ?
S'il s'agit d'une erreur de protection de la zone de texte, est-ce que cela peut vouloir dire qu'en finalité il s'agit bien du nombre de page réel indexé par GG ? (après tout je ne sais pas comment vérifier qu'ils indexent bien 8 168 684 336 pages comme ils l'annoncent à ce jour en page d'accueil).
Nota : Sur YAHOO, on arrive à des résultats du même ordre avec des requêtes type "*a" (toujours sans guillemets) pour 10 600 000 000 pages
Ce qui est affiché n'est qu'une approximation !
Non, google n'affiche pas toutes les pages
Quelqu'un qui voudrait créer son propre moteur de recherche ne pourrait-il pas s'appuyer sur ce genre de requêtes, avec un robot, pour récupérer en toute simplicité le même index que GG ?
Non, google n'affiche pas toutes les pages
-

grandmaitrezen - WRInaute discret

- Messages: 71
- Inscription: Mer Aoû 04, 2004 15:51
chmouc a écrit:Ce qui est affiché n'est qu'une approximation !
...
Non, google n'affiche pas toutes les pages
Certes, mais 10 600 000 000 pages + 4 210 000 000 pages, ce serait tout de même pas négligeable (je vois venir les matheux qui manqueront pas de me rappeler qu'il faut déduire de cette somme l'intersection des deux ensembles. Je conviens que j'ai fait un raccourci).
Vu que tu réponds à une des trois questions, je la précise, et elle sera en deux volets :
Créer le robot logiciel qui scruterait les résultats sur ce type de requêtes vous semble-t-il simple à réaliser ?
Et est-ce que ce n'est pas une partie (petite et réductrice) des fonds de commerce GG et YAHOO qui serait là en libre service ?
En somme, est-ce que ce n'est en rien dérangeant pour ces moteurs, ou bien est-ce qu'il s'agit d'une erreur, d'un oubli, qui pourraient être exploitables ?
Comme je le répéte, "Non, google n'affiche pas toutes les pages"
Oui si on aurait eu accès aux résultats
Pour ta requête -http://www.google.fr/search?q=*.*&hl=fr&lr=&start=860&sa=N
On peut pas aller plus loin que la page 87 !
Créer le robot logiciel qui scruterait les résultats sur ce type de requêtes vous semble-t-il simple à réaliser ?
Oui si on aurait eu accès aux résultats
Pour ta requête -http://www.google.fr/search?q=*.*&hl=fr&lr=&start=860&sa=N
On peut pas aller plus loin que la page 87 !
-

grandmaitrezen - WRInaute discret

- Messages: 71
- Inscription: Mer Aoû 04, 2004 15:51
chmouc a écrit:Comme je le répéte, "Non, google n'affiche pas toutes les pages"
chmouc a écrit:Oui si on aurait eu accès aux résultats
Si j'aurais su j'aurais pas venu.
Merci ! Je vais pousser les essais sur Yahoo de ce pas !
-

grandmaitrezen - WRInaute discret

- Messages: 71
- Inscription: Mer Aoû 04, 2004 15:51
Résultats :
Google : première recherche : 862 pages
En incluant les pages ignorées : 680 pages
(merci nodom, ta manip m'a fait gagner un temps sympatique
)
Yahoo : première recherche : 1000 pages
En incluant les pages ignorées : 1000 pages
Google : première recherche : 862 pages
En incluant les pages ignorées : 680 pages
(merci nodom, ta manip m'a fait gagner un temps sympatique
Yahoo : première recherche : 1000 pages
En incluant les pages ignorées : 1000 pages
Re: Caractères génériques sur Google : Résultats surprenants
grandmaitrezen a écrit:Une recherche avec "**" ou "*,*" (sans les guillemets) renvoie
4 210 000 000 pages. Initialement, je faisais juste un petit test pour voir comment il réagissait sur des caractères génériques (recherche façon MSDOS : "*.*" ).
Je te conseille de lire ceci : http://www.webrankinfo.com/forums/viewtopic_33515.htm
ça devrait t'intéresser
8 messages • Page 1 sur 1
Formation recommandée sur ce thème :
Formation Google Analytics : en 2 jours, apprenez comment exploiter l'essentiel des possibilités de l'outil de mesure d'audience de Google. Formation animée par Julien Coquet, expert certifié officiellement par Google Analytics.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Google acquiert Picasa
- Google lance Picasa en français
- Google Sitemap Generator version 1.3
- Conseils d'optimisation de la balise TITLE (titre d'une page HTML)
- Robots.txt : Yahoo supporte les options avancées
- Google offre Picasa v1.6 !
- Sites bénéficiant de plusieurs liens supplémentaires (SiteLinks) dans les résultats Google
- Référencement : TrustRank et sites dignes de confiance
- Nombre moyen de mots par requête : statistiques AOL Août 2006
- Le cache de Google : description, explications
Consultez la description détaillée des produits ou services de Google suivants : Google Website Optimizer
- Analyse du positionnement dans Google
Cet outil vous permet de vérifier si une ou plusieurs page(s) de votre site arrive(nt) dans les premiers résultats de Google, pour certains mots-clés recherchés. - Test data centers Google
Cet outil vous permet d'afficher sur une seule page les résultats Google effectués sur de nombreux data centers (centres de données). - Analyse du positionnement dans Yahoo
Cet outil vous permet de vérifier si une ou plusieurs page(s) de votre site arrive(nt) dans les premiers résultats de Yahoo, pour certains mots-clés recherchés.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités




le forum