Le crawl caching proxy de Google
14 messages • Page 1 sur 1
Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics
-

WebRankInfo - Administrateur du site

- Messages: 15839
- Inscription: Ven Avr 19, 2002 19:51
Le crawl caching proxy de Google
J'ai publié une petite explication du crawl caching proxy de Google. J'espère que je n'ai pas oublié de chose, sinon je la complèterai
et rien sur la traduction de l'article de S. Billard ?
http://s.billard.free.fr/referencement/ ... -de-google
http://s.billard.free.fr/referencement/ ... -de-google
-

WebRankInfo - Administrateur du site

- Messages: 15839
- Inscription: Ven Avr 19, 2002 19:51
merci pour l'URL, je peux pas tout faire ni tout lire... (j'étais absent tout hier, j'essaie de rattraper mon retard)
ben si mon avis vous intéresse je pense que ce truc ne fonctionne pas et est a l'origine de ce que j'ai appelé la daddy baffe !
Je m'explique. Google innove via ce truc et va en profiter pour soulager un peu ses serveurs de bots. Donc, confiant, google calibre ses bots en fonction de ce nouvel outil fabuleux. mediapartner va faire le boulot de googlebot 2...
et d’ailleurs ce dernier a disparue de nos sites, et les bots Google "classiques" crawlent les sites beaucoup beaucoup beaucoup moins. Mais c'est pas grave car "crawl caching proxy" va compenser....
sauf que... sauf que... sauf que...
CA MARCHE PAS DU TOUT
Je m'avance peut être un peu mais tout me laisse a penser que Google c'est bel et bien planté sur ce coup !
Pour étayer mes dires voici quelques points :
- Gros bordel sur les caches depuis la big daddy (voir dans ce forum)
- Gros problème d'indexation de nouvelle page pour beaucoup de site
- Yoyo des pages indexés
Si vous ne me croyez pas faites un test que j'ai moi même fait. Si vous avez le moyen de savoir quelles pages a visité le bot médiapartner depuis un bon mois, regardez le cache des pages qui ont été modifier juste avant.
Exemple : votrepage.htm a été modifier le 2 avril
le médiapartner est passé le 10 avril sur cette page
Regardez le cache dans Google
Si on en crois le fameux "crawl caching proxy" votre cache devrait être a jour. Pour ma part NADA RIEN QUEUDALE ZERO NIB aucune page crawlé par le médiapartner n'a modifier le cache de Google.
Je ne dit pas que c'est la même chose pour tout le monde, mais je ne serait pas surpris que beaucoup soient dans la même situation.
Si ma théorie est exacte Google est dans une situation un peu délicate...
Je m'explique. Google innove via ce truc et va en profiter pour soulager un peu ses serveurs de bots. Donc, confiant, google calibre ses bots en fonction de ce nouvel outil fabuleux. mediapartner va faire le boulot de googlebot 2...
et d’ailleurs ce dernier a disparue de nos sites, et les bots Google "classiques" crawlent les sites beaucoup beaucoup beaucoup moins. Mais c'est pas grave car "crawl caching proxy" va compenser....
sauf que... sauf que... sauf que...
CA MARCHE PAS DU TOUT
Je m'avance peut être un peu mais tout me laisse a penser que Google c'est bel et bien planté sur ce coup !
Pour étayer mes dires voici quelques points :
- Gros bordel sur les caches depuis la big daddy (voir dans ce forum)
- Gros problème d'indexation de nouvelle page pour beaucoup de site
- Yoyo des pages indexés
Si vous ne me croyez pas faites un test que j'ai moi même fait. Si vous avez le moyen de savoir quelles pages a visité le bot médiapartner depuis un bon mois, regardez le cache des pages qui ont été modifier juste avant.
Exemple : votrepage.htm a été modifier le 2 avril
le médiapartner est passé le 10 avril sur cette page
Regardez le cache dans Google
Si on en crois le fameux "crawl caching proxy" votre cache devrait être a jour. Pour ma part NADA RIEN QUEUDALE ZERO NIB aucune page crawlé par le médiapartner n'a modifier le cache de Google.
Je ne dit pas que c'est la même chose pour tout le monde, mais je ne serait pas surpris que beaucoup soient dans la même situation.
Si ma théorie est exacte Google est dans une situation un peu délicate...
-

Photoshop user - WRInaute accro

- Messages: 1036
- Inscription: Mer Déc 08, 2004 16:09
vanvan a écrit:Si on en crois le fameux "crawl caching proxy" votre cache devrait être a jour.
Bas non.
cette techno dis pas que le cache 'centralisé' va être maj a chaque fois par tous.
Juste que mediapartners a fait ses calcules sur le cache de GoogleBot
Photoshop user a écrit:vanvan a écrit:Si on en crois le fameux "crawl caching proxy" votre cache devrait être a jour.
Bas non.
cette techno dis pas que le cache 'centralisé' va être maj a chaque fois par tous.
Juste que mediapartners a fait ses calcules sur le cache de GoogleBot
ben oui je suis bien daccord, mais cela n'enleve rien au fait que depuis cette innovation, beaucoup beaucoup beaucoup de site se retrouve avec des cache datant de 3 mois voir beaucoup plus et de gros probleme d'indexation... Si google pouvait utiliser les caches du mediapartner pour prososer des résultats beaucoup plus pertinant, pourquoi ne le fait il pas ??? ne serais-ce pas parceque justement tout ne fonctionne pas si bien ...
-

WebRankInfo - Administrateur du site

- Messages: 15839
- Inscription: Ven Avr 19, 2002 19:51
j'ai mis à jour l'article...
le Crawl Caching Proxy de Google, la suite...
Olivier a fait un beau topo en donnant quelques explications sur le Crawl Caching Proxy de Google.
Une réflexion :
Si mon site affiche de l'adsense, suis-je privilégié pour la mise à jour de mes pages ? ... les bots d'adsense étant appelés à chaque nouvelle page crée contenant un bandeau adsense ...
D'après ce que j'ai lu, la réponse est oui
...
Si c'est le cas, yahoo adcenter, msn adcenter peuvent m'oublier je signe à vie (vie = tant que msn search n'aura pas dépassé google en part de marché) pour adsense
Une réflexion :
Si mon site affiche de l'adsense, suis-je privilégié pour la mise à jour de mes pages ? ... les bots d'adsense étant appelés à chaque nouvelle page crée contenant un bandeau adsense ...
D'après ce que j'ai lu, la réponse est oui
Si c'est le cas, yahoo adcenter, msn adcenter peuvent m'oublier je signe à vie (vie = tant que msn search n'aura pas dépassé google en part de marché) pour adsense
Tout à fait d'accord avec vanvan, depuis Bigdaddy et donc à priori de cette nouvelle technologie de bots mutualisés c'est la memerde.
Enorme yoyo au niveau des pages indexés, caches qui ont du mal, nouvelles pages qui ne s'indexent plus comme avant etc...
EDIT: le point positif quand ça marchera bien, c'est que ceux qui ont google adsense n'auront pas le crawl media partnair + googlebot + d'autre bots, ils n'auront qu'un crawl, donc gros gain de bande passante non négligeable.
Enorme yoyo au niveau des pages indexés, caches qui ont du mal, nouvelles pages qui ne s'indexent plus comme avant etc...
EDIT: le point positif quand ça marchera bien, c'est que ceux qui ont google adsense n'auront pas le crawl media partnair + googlebot + d'autre bots, ils n'auront qu'un crawl, donc gros gain de bande passante non négligeable.
Re: le Crawl Caching Proxy de Google, la suite...
legoufred a écrit:Si c'est le cas, yahoo adcenter, msn adcenter peuvent m'oublier je signe à vie (vie = tant que msn search n'aura pas dépassé google en part de marché) pour adsense
signe sur 4 générations alors vue comment c'est partis
-http://www.comscore.com/press/release.asp?press=802
-

WebRankInfo - Administrateur du site

- Messages: 15839
- Inscription: Ven Avr 19, 2002 19:51
legoufred, j'ai fusionné ton message dans cette discussion, inutile d'en créer d'autres pour l'instant...
Si mon site affiche de l'adsense, suis-je privilégié pour la mise à jour de mes pages ?
))> Pas vraiment privilégié, tu sera juste privilégié du fait que tu aura à priori moins de crawl, tu économisera de la bande passante.
Mais tu ne sera pas indexé plus rapidement car adsense va mettre ta page en cache sur un serveur proxy de google, mais tant que googlebot ne la demande pas, ta page n'est pas réellement indexé dans le moteur.
Par contre quand il la demandera il la prendra dans son cache, et ne viendra pas chez toi, tu ne verra donc pas googlebot, tu économisera donc de la bande passante
))> Pas vraiment privilégié, tu sera juste privilégié du fait que tu aura à priori moins de crawl, tu économisera de la bande passante.
Mais tu ne sera pas indexé plus rapidement car adsense va mettre ta page en cache sur un serveur proxy de google, mais tant que googlebot ne la demande pas, ta page n'est pas réellement indexé dans le moteur.
Par contre quand il la demandera il la prendra dans son cache, et ne viendra pas chez toi, tu ne verra donc pas googlebot, tu économisera donc de la bande passante
14 messages • Page 1 sur 1
Formation recommandée sur ce thème :
Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Explications sur le Crawl Caching Proxy de Google
- Le Full Crawl a enfin commencé
- Début du Full Crawl
- Le début du full crawl
- Conseils de Google pour exploiter au mieux son site web
- Petit changement pour Slurp (le robot de Yahoo)
- Du nouveau dans le Centre pour Webmasters de Live Search
- Configurer les options de passage de Googlebot sur son site
- Etude de Googlebot, le robot crawler de Google (Fresh Bot, Deep Bot)
- La vie d'une page sur le web : Fresh Crawl, Deep Crawl, Google Dance
- proxy.google.com ?
- proxy.google.com
- proxy.google.com ?
- Nokia3410/1.0 (04.26) (Google WAP Proxy/1.0)
- UP.Browser/6.1.0.1.140 (Google CHTML Proxy/1.0) ????
- SAGEM-myX-5/2.0 UP.Browser et proxy.google.com
- Google Web Accelerator comme serveur proxy ?
- Google et double crawl
- crawl google image
- X-Google-Crawl-Date
- Google ne crawl plus beaucoup !
- Crawl de google aujourd'hui
- POSTDATA de google crawl Australia
- [google] plus de crawl de mon site
- Crawl de Google erreur 404
Consultez la description détaillée des produits ou services de Google suivants : Google Webmaster Tools
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités






le forum