Caractères génériques sur Google : Résultats surprenants
8 messages
• Page 1 sur 1
Consultez la formation à Google Analytics de WebRankInfo / Ranking Metrics
-

grandmaitrezen - WRInaute discret

- Messages: 72
- Inscription: 4 Aoû 2004
Caractères génériques sur Google : Résultats surprenants
Une recherche avec "**" ou "*,*" (sans les guillemets) renvoie
4 210 000 000 pages. Initialement, je faisais juste un petit test pour voir comment il réagissait sur des caractères génériques (recherche façon MSDOS : "*.*" ).
Cela m'amène à trois questions :
Comment cela est il interprêté coté serveur ? (j'avoue, je ne connais rien en UNIX)
Quelqu'un qui voudrait créer son propre moteur de recherche ne pourrait-il pas s'appuyer sur ce genre de requêtes, avec un robot, pour récupérer en toute simplicité le même index que GG ?
S'il s'agit d'une erreur de protection de la zone de texte, est-ce que cela peut vouloir dire qu'en finalité il s'agit bien du nombre de page réel indexé par GG ? (après tout je ne sais pas comment vérifier qu'ils indexent bien 8 168 684 336 pages comme ils l'annoncent à ce jour en page d'accueil).
Nota : Sur YAHOO, on arrive à des résultats du même ordre avec des requêtes type "*a" (toujours sans guillemets) pour 10 600 000 000 pages
4 210 000 000 pages. Initialement, je faisais juste un petit test pour voir comment il réagissait sur des caractères génériques (recherche façon MSDOS : "*.*" ).
Cela m'amène à trois questions :
Comment cela est il interprêté coté serveur ? (j'avoue, je ne connais rien en UNIX)
Quelqu'un qui voudrait créer son propre moteur de recherche ne pourrait-il pas s'appuyer sur ce genre de requêtes, avec un robot, pour récupérer en toute simplicité le même index que GG ?
S'il s'agit d'une erreur de protection de la zone de texte, est-ce que cela peut vouloir dire qu'en finalité il s'agit bien du nombre de page réel indexé par GG ? (après tout je ne sais pas comment vérifier qu'ils indexent bien 8 168 684 336 pages comme ils l'annoncent à ce jour en page d'accueil).
Nota : Sur YAHOO, on arrive à des résultats du même ordre avec des requêtes type "*a" (toujours sans guillemets) pour 10 600 000 000 pages
-

chmouc - WRInaute occasionnel

- Messages: 291
- Inscription: 3 Oct 2003
Ce qui est affiché n'est qu'une approximation !
Non, google n'affiche pas toutes les pages
Quelqu'un qui voudrait créer son propre moteur de recherche ne pourrait-il pas s'appuyer sur ce genre de requêtes, avec un robot, pour récupérer en toute simplicité le même index que GG ?
Non, google n'affiche pas toutes les pages
-

grandmaitrezen - WRInaute discret

- Messages: 72
- Inscription: 4 Aoû 2004
chmouc a écrit:Ce qui est affiché n'est qu'une approximation !
...
Non, google n'affiche pas toutes les pages
Certes, mais 10 600 000 000 pages + 4 210 000 000 pages, ce serait tout de même pas négligeable (je vois venir les matheux qui manqueront pas de me rappeler qu'il faut déduire de cette somme l'intersection des deux ensembles. Je conviens que j'ai fait un raccourci).
Vu que tu réponds à une des trois questions, je la précise, et elle sera en deux volets :
Créer le robot logiciel qui scruterait les résultats sur ce type de requêtes vous semble-t-il simple à réaliser ?
Et est-ce que ce n'est pas une partie (petite et réductrice) des fonds de commerce GG et YAHOO qui serait là en libre service ?
En somme, est-ce que ce n'est en rien dérangeant pour ces moteurs, ou bien est-ce qu'il s'agit d'une erreur, d'un oubli, qui pourraient être exploitables ?
-

chmouc - WRInaute occasionnel

- Messages: 291
- Inscription: 3 Oct 2003
Comme je le répéte, "Non, google n'affiche pas toutes les pages"
Oui si on aurait eu accès aux résultats
Pour ta requête -http://www.google.fr/search?q=*.*&hl=fr&lr=&start=860&sa=N
On peut pas aller plus loin que la page 87 !
Créer le robot logiciel qui scruterait les résultats sur ce type de requêtes vous semble-t-il simple à réaliser ?
Oui si on aurait eu accès aux résultats
Pour ta requête -http://www.google.fr/search?q=*.*&hl=fr&lr=&start=860&sa=N
On peut pas aller plus loin que la page 87 !
-

grandmaitrezen - WRInaute discret

- Messages: 72
- Inscription: 4 Aoû 2004
chmouc a écrit:Comme je le répéte, "Non, google n'affiche pas toutes les pages"
chmouc a écrit:Oui si on aurait eu accès aux résultats
Si j'aurais su j'aurais pas venu.
Merci ! Je vais pousser les essais sur Yahoo de ce pas !
-

grandmaitrezen - WRInaute discret

- Messages: 72
- Inscription: 4 Aoû 2004
Résultats :
Google : première recherche : 862 pages
En incluant les pages ignorées : 680 pages
(merci nodom, ta manip m'a fait gagner un temps sympatique
)
Yahoo : première recherche : 1000 pages
En incluant les pages ignorées : 1000 pages
Google : première recherche : 862 pages
En incluant les pages ignorées : 680 pages
(merci nodom, ta manip m'a fait gagner un temps sympatique
Yahoo : première recherche : 1000 pages
En incluant les pages ignorées : 1000 pages
-

TOMHTML - WRInaute accro

- Messages: 3250
- Inscription: 25 Aoû 2004
Re: Caractères génériques sur Google : Résultats surprenants
grandmaitrezen a écrit:Une recherche avec "**" ou "*,*" (sans les guillemets) renvoie
4 210 000 000 pages. Initialement, je faisais juste un petit test pour voir comment il réagissait sur des caractères génériques (recherche façon MSDOS : "*.*" ).
Je te conseille de lire ceci : http://www.webrankinfo.com/forums/viewtopic_33515.htm
ça devrait t'intéresser
8 messages
• Page 1 sur 1
Formation recommandée sur ce thème :
Formation Google Analytics : en 2 jours, apprenez comment exploiter l'essentiel des possibilités de l'outil de mesure d'audience de Google. Formation animée par les experts Google Analytics de Ranking Metrics.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Resultats Overture surprenants ....
- Caractères spéciaux et résultats Google
- Yahoo fait des substitution de caractères dans les résultats
- Avis sur mon site de cadeaux insolites, utiles et surprenants
- mots clés génériques + marque
- Amélioration du référencement, mots-clés génériques
- [Regex] Classes génériques PCRE et accents
- Résultats google - sous résultats
- Yoyo sur des mots clés génériques
- Index déclassé sur des termes génériques
- Le secret des doubles-résultats - 22-10-2004
- Google API : guide de développement de l'API Google - 20-09-2002
- Conseils d'optimisation de la balise TITLE (titre d'une page HTML) - 04-08-2008
- Résultats financiers de Google : 4ème trimestre 2007 - 01-02-2008
- Résultats financiers de Google au 3ème trimestre 2008 : pas de crise chez Google ! - 17-10-2008
- Google facilite l'affichage de + de 2 résultats par sous-domaine (clustering) - 31-07-2009
- Résultats financiers de Google en 2006 - 01-02-2007
- Recherche dans l'actualité WebRankInfo - 22-10-2005
Consultez la description détaillée des produits ou services de Google suivants : Google Website Optimizer
- Analyse du positionnement dans Google
Cet outil vous permet de vérifier si une ou plusieurs page(s) de votre site arrive(nt) dans les premiers résultats de Google, pour certains mots-clés recherchés. - Test data centers Google
Cet outil vous permet d'afficher sur une seule page les résultats Google effectués sur de nombreux data centers (centres de données). - Analyse du positionnement dans Yahoo
Cet outil vous permet de vérifier si une ou plusieurs page(s) de votre site arrive(nt) dans les premiers résultats de Yahoo, pour certains mots-clés recherchés.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités
