Description du système de crawl et d'indexation de Google
40 messages • Page 1 sur 3 • 1, 2, 3
Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics
-

WebRankInfo - Administrateur du site

- Messages: 15881
- Inscription: Ven Avr 19, 2002 19:51
Description du système de crawl et d'indexation de Google
Je vous ai fait un petit résumé de l'état actuel du système de crawl de Google. Bonne lecture !
C'est un article réellement très intéressant, il y a matière à discussion en effet.
Mon sentiment depuis 2006, c'était que GG donnait une certaine priorité au crawl des redirections (c'est pour ça que j'avais froidement mis les berszerkers derrière une 302 du root).
Mon sentiment depuis 2006, c'était que GG donnait une certaine priorité au crawl des redirections (c'est pour ça que j'avais froidement mis les berszerkers derrière une 302 du root).
- V1tr1neMag1que
- WRInaute occasionnel

- Messages: 136
- Inscription: Mer Déc 12, 2007 9:11
interressant
+1 reco
+1 reco
-

WebRankInfo - Administrateur du site

- Messages: 15881
- Inscription: Ven Avr 19, 2002 19:51
Merci, je suis sur une bonne lancée avec mes derniers articles vu vos remerciements. J'en ai encore qq uns sous le coude pour la rentrée
-

guide-de-stockholm - WRInaute occasionnel

- Messages: 165
- Inscription: Ven Avr 11, 2008 13:07
Donc si je comprends bien, un site qui est dans la "couche de base" et qui se fait pomper son contenu par un site dans la "couche quotidienne" sera celui qui fait du duplicate content parce que le second site sera plus rapidement indexé et donc son contenu considéré comme plus ancien?
Rien de bien nouveau. On sait bien que la fréquence de crawl des pages sur internet n'est pas la même pour toutes et que beaucoup de paramètres rentrent en jeu (comme ceux que tu as marqué et sûrement d'autres).
J'aime bien quand tu marques "est très vieux (il a été déposé en juillet 2003 et accepté fin 2007) et Google a sans doute adapté son système depuis..." et dans le titre de ton lien " l'état actuel du système " ...
J'aime bien quand tu marques "est très vieux (il a été déposé en juillet 2003 et accepté fin 2007) et Google a sans doute adapté son système depuis..." et dans le titre de ton lien " l'état actuel du système " ...
Le kiwi est radin :de-kiwi a écrit:en même temps, je pense que celui là est intéressant pour tous les membres de Wri, quelqusoit le niveau. j'ai mis une reco aussi, et je crois que depuis le début c'est la seconde que je met, c'est pour dire
Il ne faut pas confondre :guide-de-stockholm a écrit:Donc si je comprends bien, un site qui est dans la "couche de base" et qui se fait pomper son contenu par un site dans la "couche quotidienne" sera celui qui fait du duplicate content parce que le second site sera plus rapidement indexé et donc son contenu considéré comme plus ancien?
- Crawl de la page (qui permet de prendre date)
- Insertion dans l'index (les fameuses couches)
-

guide-de-stockholm - WRInaute occasionnel

- Messages: 165
- Inscription: Ven Avr 11, 2008 13:07
Zecat a écrit:Il ne faut pas confondre :guide-de-stockholm a écrit:Donc si je comprends bien, un site qui est dans la "couche de base" et qui se fait pomper son contenu par un site dans la "couche quotidienne" sera celui qui fait du duplicate content parce que le second site sera plus rapidement indexé et donc son contenu considéré comme plus ancien?
- Crawl de la page (qui permet de prendre date)
- Insertion dans l'index (les fameuses couches)
Justement, le site qui est crawlé plus fréquemment aura la date la plus ancienne (de crawl pour un contenu en particulier).
-

Djoule_logo - WRInaute passionné

- Messages: 712
- Inscription: Mer Mai 30, 2007 0:21
Zecat a écrit:Il ne faut pas confondre :guide-de-stockholm a écrit:Donc si je comprends bien, un site qui est dans la "couche de base" et qui se fait pomper son contenu par un site dans la "couche quotidienne" sera celui qui fait du duplicate content parce que le second site sera plus rapidement indexé et donc son contenu considéré comme plus ancien?
- Crawl de la page (qui permet de prendre date)
- Insertion dans l'index (les fameuses couches)
Oui, mais on est bien d'accord qu'un site faisant partie de la couche quotidienne sera crawlé tres frequement (sans parler d'inclusion dans l'index). Donc une nouvelle page sera très vite vue. Alors qu'un site de la couche de base sera crawler moins frequement, et une nouvelle page peut être decouverte plusieurs jours après sa mise en ligne.
Le problème du DC reste donc entier.
40 messages • Page 1 sur 3 • 1, 2, 3
Formation recommandée sur ce thème :
Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Le Full Crawl a enfin commencé
- Etude de Googlebot, le robot crawler de Google (Fresh Bot, Deep Bot)
- Début du Full Crawl
- Explications sur le Crawl Caching Proxy de Google
- Du nouveau dans le Centre pour Webmasters de Live Search
- Présentation de l'indexation Google - Googlebot, le robot de Google
- Le système de crawl de Google en 2008
- Le début du full crawl
- La vie d'une page sur le web : Fresh Crawl, Deep Crawl, Google Dance
- L'algorithme de Google en résumé (mars 2003)
Consultez la description détaillée des produits ou services de Google suivants : Google Webmaster Tools
- Calcul d'indice de densité
Cet outil vous permet de calculer l'indice de densité d'un mot-clé d'une page web. Il est calculé à la fois pour la balise TITLE, la balise META description et l'ensemble du texte de la page. - Touch Graph Google Browser
Description du TouchGraph Google Browser (outil externe) : il s'agit d'un outil graphique permettant de visualiser des sites similaires (selon Google). On peut sauter de site en site, et se rendre compte facilement des communautés de sites, ou des nébuleuses de sites traitant du même sujet. - Déterminer l'ancienneté d'un site
Cet outil vous permet de connaître une estimation de l'ancienneté d'un site : il fournit la date à laquelle Google l'a indexé la première fois (et la même chose pour archive.org). - Lister les sous-domaines
Cet outil vous permet de trouver la liste des sous-domaines (indexés) d'un site.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités







le forum