Description du système de crawl et d'indexation de Google
40 messages
• Page 1 sur 3 • 1, 2, 3
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
-

WebRankInfo - Administrateur du site

- Messages: 19415
- Inscription: 19 Avr 2002
Description du système de crawl et d'indexation de Google
Je vous ai fait un petit résumé de l'état actuel du système de crawl de Google. Bonne lecture !
-

Szarah - WRInaute accro

- Messages: 8093
- Inscription: 22 Fév 2006
C'est un article réellement très intéressant, il y a matière à discussion en effet.
Mon sentiment depuis 2006, c'était que GG donnait une certaine priorité au crawl des redirections (c'est pour ça que j'avais froidement mis les berszerkers derrière une 302 du root).
Mon sentiment depuis 2006, c'était que GG donnait une certaine priorité au crawl des redirections (c'est pour ça que j'avais froidement mis les berszerkers derrière une 302 du root).
-

WebRankInfo - Administrateur du site

- Messages: 19415
- Inscription: 19 Avr 2002
Merci, je suis sur une bonne lancée avec mes derniers articles vu vos remerciements. J'en ai encore qq uns sous le coude pour la rentrée
-

guide-de-stockholm - WRInaute discret

- Messages: 165
- Inscription: 11 Avr 2008
Donc si je comprends bien, un site qui est dans la "couche de base" et qui se fait pomper son contenu par un site dans la "couche quotidienne" sera celui qui fait du duplicate content parce que le second site sera plus rapidement indexé et donc son contenu considéré comme plus ancien?
- Fnnyaert
- WRInaute discret

- Messages: 63
- Inscription: 25 Déc 2007
Rien de bien nouveau. On sait bien que la fréquence de crawl des pages sur internet n'est pas la même pour toutes et que beaucoup de paramètres rentrent en jeu (comme ceux que tu as marqué et sûrement d'autres).
J'aime bien quand tu marques "est très vieux (il a été déposé en juillet 2003 et accepté fin 2007) et Google a sans doute adapté son système depuis..." et dans le titre de ton lien " l'état actuel du système " ...
J'aime bien quand tu marques "est très vieux (il a été déposé en juillet 2003 et accepté fin 2007) et Google a sans doute adapté son système depuis..." et dans le titre de ton lien " l'état actuel du système " ...
-

Zecat - WRInaute accro

- Messages: 11994
- Inscription: 1 Mar 2005
Le kiwi est radin :de-kiwi a écrit:en même temps, je pense que celui là est intéressant pour tous les membres de Wri, quelqusoit le niveau. j'ai mis une reco aussi, et je crois que depuis le début c'est la seconde que je met, c'est pour dire
-

Zecat - WRInaute accro

- Messages: 11994
- Inscription: 1 Mar 2005
Il ne faut pas confondre :guide-de-stockholm a écrit:Donc si je comprends bien, un site qui est dans la "couche de base" et qui se fait pomper son contenu par un site dans la "couche quotidienne" sera celui qui fait du duplicate content parce que le second site sera plus rapidement indexé et donc son contenu considéré comme plus ancien?
- Crawl de la page (qui permet de prendre date)
- Insertion dans l'index (les fameuses couches)
-

guide-de-stockholm - WRInaute discret

- Messages: 165
- Inscription: 11 Avr 2008
Zecat a écrit:Il ne faut pas confondre :guide-de-stockholm a écrit:Donc si je comprends bien, un site qui est dans la "couche de base" et qui se fait pomper son contenu par un site dans la "couche quotidienne" sera celui qui fait du duplicate content parce que le second site sera plus rapidement indexé et donc son contenu considéré comme plus ancien?
- Crawl de la page (qui permet de prendre date)
- Insertion dans l'index (les fameuses couches)
Justement, le site qui est crawlé plus fréquemment aura la date la plus ancienne (de crawl pour un contenu en particulier).
-

Djoule_logo - WRInaute impliqué

- Messages: 718
- Inscription: 30 Mai 2007
Zecat a écrit:Il ne faut pas confondre :guide-de-stockholm a écrit:Donc si je comprends bien, un site qui est dans la "couche de base" et qui se fait pomper son contenu par un site dans la "couche quotidienne" sera celui qui fait du duplicate content parce que le second site sera plus rapidement indexé et donc son contenu considéré comme plus ancien?
- Crawl de la page (qui permet de prendre date)
- Insertion dans l'index (les fameuses couches)
Oui, mais on est bien d'accord qu'un site faisant partie de la couche quotidienne sera crawlé tres frequement (sans parler d'inclusion dans l'index). Donc une nouvelle page sera très vite vue. Alors qu'un site de la couche de base sera crawler moins frequement, et une nouvelle page peut être decouverte plusieurs jours après sa mise en ligne.
Le problème du DC reste donc entier.
40 messages
• Page 1 sur 3 • 1, 2, 3
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Question sur Crawl google et description des pages
- google crawl indexation nouveaux domaines
- Temps entre crawl et indexation
- [Problème] Indexation/Crawl d'un site
- Crawl des pages mais pas indexation?
- Indexation des pages avec un système d'inclusion
- Problème de description... et indexation
- Indexation et meta description
- Supprimer description DMOZ dans la description Google ?
- Description google différente de ma méta description
Consultez la description détaillée des produits ou services de Google suivants : Google Webmaster Tools
- Calcul d'indice de densité
Cet outil vous permet de calculer l'indice de densité d'un mot-clé d'une page web. Il est calculé à la fois pour la balise TITLE, la balise META description et l'ensemble du texte de la page. - Touch Graph Google Browser
Description du TouchGraph Google Browser (outil externe) : il s'agit d'un outil graphique permettant de visualiser des sites similaires (selon Google). On peut sauter de site en site, et se rendre compte facilement des communautés de sites, ou des nébuleuses de sites traitant du même sujet. - Déterminer l'ancienneté d'un site
Cet outil vous permet de connaître une estimation de l'ancienneté d'un site : il fournit la date à laquelle Google l'a indexé la première fois (et la même chose pour archive.org). - Lister les sous-domaines
Cet outil vous permet de trouver la liste des sous-domaines (indexés) d'un site.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités


