Description du système de crawl et d'indexation de Google
40 messages • Page 2 sur 3 • 1, 2, 3
Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics
Ce qui serait bien aussi, c'est une explication sur comment et pourquoi une page actualité est priorisé et ensuite mis très loin aux oubliettes. Donc comment concevoir une page qui traite d'Actualités tous en restant dans le Top10 sur google pendant plusieurs mois.
domdom26 a écrit:Ce qui serait bien aussi, c'est une explication sur comment et pourquoi une page actualité est priorisé et ensuite mis très loin aux oubliettes. Donc comment concevoir une page qui traite d'Actualités tous en restant dans le Top10 sur google pendant plusieurs mois.
L'"actualité" est un truc jetable par excellence. Une dépêche sera logiquement mise au top puis chassée par les analyses et les dossiers la concernant.
C'est la réponse : évolution.
Les malins modifient à peine le papier de départ, lui ajoutant les menues nouveautés, et ils modifient légèrement le title en gardant les mots-clés. Suffit de surveiller GG-news pour le constater.
-

WebRankInfo - Administrateur du site

- Messages: 15896
- Inscription: Ven Avr 19, 2002 19:51
en cas de contenus dupliqués, pour identifier la source, Google utilise d'autres critères que la chronologie des crawls des différentes versions. Par exemple, le netlinking entre en jeu
@Fnnyaert : merci pour la remarque, je vais corriger mon titre. Par contre je vais oublier le reste de ton message, car j'ai du mal avec ceux qui ne sont jamais satisfaits de trouver gratuitement du contenu sur WRI...
edit : ce n'était pas un titre mais un sous-titre à l'intérieur de l'article. J'avais mis "actuel" par opposition à la description du système de crawl datant de l'époque des Google Dance. enfin bon, c'est du détail hein...
@Fnnyaert : merci pour la remarque, je vais corriger mon titre. Par contre je vais oublier le reste de ton message, car j'ai du mal avec ceux qui ne sont jamais satisfaits de trouver gratuitement du contenu sur WRI...
edit : ce n'était pas un titre mais un sous-titre à l'intérieur de l'article. J'avais mis "actuel" par opposition à la description du système de crawl datant de l'époque des Google Dance. enfin bon, c'est du détail hein...
-

WebRankInfo - Administrateur du site

- Messages: 15896
- Inscription: Ven Avr 19, 2002 19:51
tophus a écrit:Je rajouterais Google peut également découvrir par la google toolbar. Je crois que ce n'est plus à démontrer.
Matt Cutts a pourtant encore dit le contraire le mois dernier : http://www.mattcutts.com/blog/toolbar-i ... bunk-post/
cela dit ce n'est pas bien important...
-

Audiofeeline - WRInaute accro

- Messages: 5181
- Inscription: Jeu Oct 20, 2005 19:47
e-kiwi a écrit:moi ce qui m'intéresse, c'est d'avoir plus d'informations sur :
"certaines thématiques sont traitées de façon spécifique, comme par exemple l'actualité."
En effet, je suis assez concerné par ça. Le fait de traiter des "news du jour" favorise un peu l'indexation. Je ne sais pas trop comment ça fonctionne (j'imagine que c'est un truc qui utilise le principe de Google News) mais généralement Google arrive a positionner des résultats récents notamment sur des trucs qui buzz durant une journée par exemple.
Après c'est classique : ancienneté du site, force du référencement, pertinence, etc.
C'est assez nouveau, ça du être introduit en même temps que l'indexation en "temps réel".
tophus a écrit:Je crois que ce n'est plus à démontrer.
Négatif, Olivier, tu n'as pas fait des tests là dessus ?
Je pencherai plus pour une histoire de cookie ou de referer.
Avec la GGbar installée, la consultation d'une page envoie une requête à GG pour pouvoir afficher le PR de la page, je pense que ça, c'est certain.
Maintenant, si Matt Cutts affirme que quand GG reçoit l'info qu'il existe une page inconnue de sa bdd, il ne fait rien, bin ok, ok ok. S'il le dit ...
Maintenant, si Matt Cutts affirme que quand GG reçoit l'info qu'il existe une page inconnue de sa bdd, il ne fait rien, bin ok, ok ok. S'il le dit ...
En lisant ça, je vois que j'ai encore du chemin à parcourir. Je n'avais pas du tout connaissance de ce genre de système, même si à le lire ça semble plutôt logique.
Mais un site qui ne fait pas d'actualités, mais qui a un contenu mis à jour quotidiennement. Par exemple je prends mon cas, les membres viennent mettre des projets. Le jour où le site aura une activité importante, il y aura beaucoup de projets posté chaque jour. Si en page d'accueil je mets les derniers projets ajoutés, google vient t'il chaque minute, ou préfère t'il mettre comme un site à voir quotidiennement, ou alors je reste définitivement en couche de base ?
Mais un site qui ne fait pas d'actualités, mais qui a un contenu mis à jour quotidiennement. Par exemple je prends mon cas, les membres viennent mettre des projets. Le jour où le site aura une activité importante, il y aura beaucoup de projets posté chaque jour. Si en page d'accueil je mets les derniers projets ajoutés, google vient t'il chaque minute, ou préfère t'il mettre comme un site à voir quotidiennement, ou alors je reste définitivement en couche de base ?
WebRankInfo a écrit:Matt Cutts a pourtant encore dit le contraire le mois dernier : http://www.mattcutts.com/blog/toolbar-i ... bunk-post/
cela dit ce n'est pas bien important...
C'est toujours intéressant de savoir l'information.
- V1tr1neMag1que
- WRInaute occasionnel

- Messages: 136
- Inscription: Mer Déc 12, 2007 9:11
Druidefou a écrit:Si en page d'accueil je mets les derniers projets ajoutés, google vient t'il chaque minute, ou préfère t'il mettre comme un site à voir quotidiennement, ou alors je reste définitivement en couche de base ?
tu as la réponse au dessus :
Audiofeeline a écrit:Après c'est classique : ancienneté du site, force du référencement, pertinence, etc..
tout simplement
Je veux bien croire Matt Cutts....
Mais dans ce cas, difficile d'expliquer comment des sites en cours de dev se retrouvent indexés.
Je travail seul, aucune personne ne connais mes ndd en cours de dev, aucun lien, pas de rss , rien.
Dernier exemple; j'utilise un cms, je copie mes BDD d'un site à l'autre pour tester avec du contenu.
Surprise, je retrouve indexé le site en dev en moins de 24h.
Avec en prime un contenu dupliqué. et une apparition sur la première page des deux site en questions.....
Je vois vraiment pas comment le site a été crawlé si ce n'ai pas par GGbar. le site est uniquement indexé dans GG, aucun autre moteur ne l'a trouvé...
GG ferait peut être dans la voyance.
Mais dans ce cas, difficile d'expliquer comment des sites en cours de dev se retrouvent indexés.
Je travail seul, aucune personne ne connais mes ndd en cours de dev, aucun lien, pas de rss , rien.
Dernier exemple; j'utilise un cms, je copie mes BDD d'un site à l'autre pour tester avec du contenu.
Surprise, je retrouve indexé le site en dev en moins de 24h.
Avec en prime un contenu dupliqué. et une apparition sur la première page des deux site en questions.....
Je vois vraiment pas comment le site a été crawlé si ce n'ai pas par GGbar. le site est uniquement indexé dans GG, aucun autre moteur ne l'a trouvé...
GG ferait peut être dans la voyance.
WebRankInfo a écrit:tophus a écrit:Je rajouterais Google peut également découvrir par la google toolbar. Je crois que ce n'est plus à démontrer.
Matt Cutts a pourtant encore dit le contraire le mois dernier : http://www.mattcutts.com/blog/toolbar-i ... bunk-post/
cela dit ce n'est pas bien important...
Je travaillais sur un site il y a quelques mois. Je suis le seul à connaître l'url. Et ben google le connait déjà... et j'ai une toolbar
bon article sinon
thony25 a écrit: Je suis le seul à connaître l'url. Et ben google le connait déjà...
Toutes façons Google connaît tout ... la dernière fois je cherchais mon portable, j'ai demandé à Google il m'a indiqué qu'il était sous mon lit ... formidable, mais jusqu'où iront ils ...
Sérieusement si Matt Cutts a indiqué que non pour la toolbars c'est peut être pour que les gens continuent à l'installer sans crainte ... après tout, se faire tiré des informations à son insu n'est pas très rassurant. Mais c'est vrai que c'est pas très important.
40 messages • Page 2 sur 3 • 1, 2, 3
Formation recommandée sur ce thème :
Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Le Full Crawl a enfin commencé
- Etude de Googlebot, le robot crawler de Google (Fresh Bot, Deep Bot)
- Début du Full Crawl
- Explications sur le Crawl Caching Proxy de Google
- Du nouveau dans le Centre pour Webmasters de Live Search
- Présentation de l'indexation Google - Googlebot, le robot de Google
- Le système de crawl de Google en 2008
- Le début du full crawl
- La vie d'une page sur le web : Fresh Crawl, Deep Crawl, Google Dance
- L'algorithme de Google en résumé (mars 2003)
Consultez la description détaillée des produits ou services de Google suivants : Google Webmaster Tools
- Calcul d'indice de densité
Cet outil vous permet de calculer l'indice de densité d'un mot-clé d'une page web. Il est calculé à la fois pour la balise TITLE, la balise META description et l'ensemble du texte de la page. - Touch Graph Google Browser
Description du TouchGraph Google Browser (outil externe) : il s'agit d'un outil graphique permettant de visualiser des sites similaires (selon Google). On peut sauter de site en site, et se rendre compte facilement des communautés de sites, ou des nébuleuses de sites traitant du même sujet. - Déterminer l'ancienneté d'un site
Cet outil vous permet de connaître une estimation de l'ancienneté d'un site : il fournit la date à laquelle Google l'a indexé la première fois (et la même chose pour archive.org). - Lister les sous-domaines
Cet outil vous permet de trouver la liste des sous-domaines (indexés) d'un site.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités







le forum