Description du système de crawl et d'indexation de Google

Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics

domdom26
WRInaute passionné
WRInaute passionné
 
Messages: 632
Inscription: Mar Nov 09, 2004 6:59

Message le Jeu Aoû 21, 2008 1:59

Ce qui serait bien aussi, c'est une explication sur comment et pourquoi une page actualité est priorisé et ensuite mis très loin aux oubliettes. Donc comment concevoir une page qui traite d'Actualités tous en restant dans le Top10 sur google pendant plusieurs mois.


Szarah
WRInaute accro
WRInaute accro
 
Messages: 8090
Inscription: Mer Fév 22, 2006 18:24

Message le Jeu Aoû 21, 2008 7:47

domdom26 a écrit:Ce qui serait bien aussi, c'est une explication sur comment et pourquoi une page actualité est priorisé et ensuite mis très loin aux oubliettes. Donc comment concevoir une page qui traite d'Actualités tous en restant dans le Top10 sur google pendant plusieurs mois.

L'"actualité" est un truc jetable par excellence. Une dépêche sera logiquement mise au top puis chassée par les analyses et les dossiers la concernant.
C'est la réponse : évolution.
Les malins modifient à peine le papier de départ, lui ajoutant les menues nouveautés, et ils modifient légèrement le title en gardant les mots-clés. Suffit de surveiller GG-news pour le constater.


e-kiwi
Modérateur
Modérateur
 
Messages: 13867
Inscription: Mar Déc 23, 2003 9:04

Message le Jeu Aoû 21, 2008 8:08

je pense effectivement que Google sait gérer ce cas.


WebRankInfo
Administrateur du site
Administrateur du site
 
Messages: 15896
Inscription: Ven Avr 19, 2002 19:51

Message le Jeu Aoû 21, 2008 10:09

en cas de contenus dupliqués, pour identifier la source, Google utilise d'autres critères que la chronologie des crawls des différentes versions. Par exemple, le netlinking entre en jeu

@Fnnyaert : merci pour la remarque, je vais corriger mon titre. Par contre je vais oublier le reste de ton message, car j'ai du mal avec ceux qui ne sont jamais satisfaits de trouver gratuitement du contenu sur WRI...

edit : ce n'était pas un titre mais un sous-titre à l'intérieur de l'article. J'avais mis "actuel" par opposition à la description du système de crawl datant de l'époque des Google Dance. enfin bon, c'est du détail hein...

tophus
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 210
Inscription: Ven Aoû 12, 2005 8:23

Message le Ven Aoû 22, 2008 8:52

Merci, bon article!

Pour en revenir à la découverte d'URL et niveaux de crawl:
Je rajouterais Google peut également découvrir par la google toolbar. Je crois que ce n'est plus à démontrer.


WebRankInfo
Administrateur du site
Administrateur du site
 
Messages: 15896
Inscription: Ven Avr 19, 2002 19:51

Message le Ven Aoû 22, 2008 9:09

tophus a écrit:Je rajouterais Google peut également découvrir par la google toolbar. Je crois que ce n'est plus à démontrer.


Matt Cutts a pourtant encore dit le contraire le mois dernier : http://www.mattcutts.com/blog/toolbar-i ... bunk-post/

cela dit ce n'est pas bien important...


Audiofeeline
WRInaute accro
WRInaute accro
 
Messages: 5181
Inscription: Jeu Oct 20, 2005 19:47

Message le Ven Aoû 22, 2008 10:47

e-kiwi a écrit:moi ce qui m'intéresse, c'est d'avoir plus d'informations sur :
"certaines thématiques sont traitées de façon spécifique, comme par exemple l'actualité."

En effet, je suis assez concerné par ça. Le fait de traiter des "news du jour" favorise un peu l'indexation. Je ne sais pas trop comment ça fonctionne (j'imagine que c'est un truc qui utilise le principe de Google News) mais généralement Google arrive a positionner des résultats récents notamment sur des trucs qui buzz durant une journée par exemple.
Après c'est classique : ancienneté du site, force du référencement, pertinence, etc.
C'est assez nouveau, ça du être introduit en même temps que l'indexation en "temps réel".

tophus a écrit:Je crois que ce n'est plus à démontrer.

Négatif, Olivier, tu n'as pas fait des tests là dessus ?
Je pencherai plus pour une histoire de cookie ou de referer.


Szarah
WRInaute accro
WRInaute accro
 
Messages: 8090
Inscription: Mer Fév 22, 2006 18:24

Message le Ven Aoû 22, 2008 11:45

Avec la GGbar installée, la consultation d'une page envoie une requête à GG pour pouvoir afficher le PR de la page, je pense que ça, c'est certain.
Maintenant, si Matt Cutts affirme que quand GG reçoit l'info qu'il existe une page inconnue de sa bdd, il ne fait rien, bin ok, ok ok. S'il le dit ...

Druidefou
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 151
Inscription: Mer Aoû 10, 2005 18:42

Message le Ven Aoû 22, 2008 12:00

En lisant ça, je vois que j'ai encore du chemin à parcourir. Je n'avais pas du tout connaissance de ce genre de système, même si à le lire ça semble plutôt logique.

Mais un site qui ne fait pas d'actualités, mais qui a un contenu mis à jour quotidiennement. Par exemple je prends mon cas, les membres viennent mettre des projets. Le jour où le site aura une activité importante, il y aura beaucoup de projets posté chaque jour. Si en page d'accueil je mets les derniers projets ajoutés, google vient t'il chaque minute, ou préfère t'il mettre comme un site à voir quotidiennement, ou alors je reste définitivement en couche de base ?


Madrileño
Madrileño
Madrileño
 
Messages: 19982
Inscription: Mer Juil 07, 2004 12:14

Message le Ven Aoû 22, 2008 12:28

WebRankInfo a écrit:Matt Cutts a pourtant encore dit le contraire le mois dernier : http://www.mattcutts.com/blog/toolbar-i ... bunk-post/
cela dit ce n'est pas bien important...

C'est toujours intéressant de savoir l'information.

V1tr1neMag1que
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 136
Inscription: Mer Déc 12, 2007 9:11

Message le Ven Aoû 22, 2008 13:11

Druidefou a écrit:Si en page d'accueil je mets les derniers projets ajoutés, google vient t'il chaque minute, ou préfère t'il mettre comme un site à voir quotidiennement, ou alors je reste définitivement en couche de base ?


tu as la réponse au dessus :
Audiofeeline a écrit:Après c'est classique : ancienneté du site, force du référencement, pertinence, etc..



tout simplement

tophus
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 210
Inscription: Ven Aoû 12, 2005 8:23

Message le Ven Aoû 22, 2008 14:43

Je veux bien croire Matt Cutts....
Mais dans ce cas, difficile d'expliquer comment des sites en cours de dev se retrouvent indexés.
Je travail seul, aucune personne ne connais mes ndd en cours de dev, aucun lien, pas de rss , rien.
Dernier exemple; j'utilise un cms, je copie mes BDD d'un site à l'autre pour tester avec du contenu.
Surprise, je retrouve indexé le site en dev en moins de 24h.
Avec en prime un contenu dupliqué. et une apparition sur la première page des deux site en questions.....
Je vois vraiment pas comment le site a été crawlé si ce n'ai pas par GGbar. le site est uniquement indexé dans GG, aucun autre moteur ne l'a trouvé...
GG ferait peut être dans la voyance.

thony25
WRInaute discret
WRInaute discret
 
Messages: 92
Inscription: Mer Mai 05, 2004 16:56

Message le Ven Aoû 22, 2008 20:59

WebRankInfo a écrit:
tophus a écrit:Je rajouterais Google peut également découvrir par la google toolbar. Je crois que ce n'est plus à démontrer.


Matt Cutts a pourtant encore dit le contraire le mois dernier : http://www.mattcutts.com/blog/toolbar-i ... bunk-post/

cela dit ce n'est pas bien important...

Je travaillais sur un site il y a quelques mois. Je suis le seul à connaître l'url. Et ben google le connait déjà... et j'ai une toolbar :)

bon article sinon


YoyoS
WRInaute accro
WRInaute accro
 
Messages: 3062
Inscription: Jeu Sep 14, 2006 4:53

Message le Ven Aoû 22, 2008 21:25

Et pourquoi vous avez la barre google au fait ? :p Si y a bien un truc inutile, c'est ça !

Fnnyaert
WRInaute discret
WRInaute discret
 
Messages: 61
Inscription: Mar Déc 25, 2007 22:37

Message le Ven Aoû 22, 2008 21:27

thony25 a écrit: Je suis le seul à connaître l'url. Et ben google le connait déjà...


Toutes façons Google connaît tout ... la dernière fois je cherchais mon portable, j'ai demandé à Google il m'a indiqué qu'il était sous mon lit ... formidable, mais jusqu'où iront ils ...

Sérieusement si Matt Cutts a indiqué que non pour la toolbars c'est peut être pour que les gens continuent à l'installer sans crainte ... après tout, se faire tiré des informations à son insu n'est pas très rassurant. Mais c'est vrai que c'est pas très important.

Description du système de crawl et d'indexation de Google Description du système de crawl et d'indexation de Google

Formation recommandée sur ce thème :

Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :

Consultez la description détaillée des produits ou services de Google suivants : Google Webmaster Tools

  • Calcul d'indice de densité
    Cet outil vous permet de calculer l'indice de densité d'un mot-clé d'une page web. Il est calculé à la fois pour la balise TITLE, la balise META description et l'ensemble du texte de la page.
  • Touch Graph Google Browser
    Description du TouchGraph Google Browser (outil externe) : il s'agit d'un outil graphique permettant de visualiser des sites similaires (selon Google). On peut sauter de site en site, et se rendre compte facilement des communautés de sites, ou des nébuleuses de sites traitant du même sujet.
  • Déterminer l'ancienneté d'un site
    Cet outil vous permet de connaître une estimation de l'ancienneté d'un site : il fournit la date à laquelle Google l'a indexé la première fois (et la même chose pour archive.org).
  • Lister les sous-domaines
    Cet outil vous permet de trouver la liste des sous-domaines (indexés) d'un site.


Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités