Pages crawlées et pages indexées

Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics


pooxeur
WRInaute discret
WRInaute discret
 
Messages: 231
Inscription: 23 Déc 2004

Pages crawlées et pages indexées

Message le Jeu Avr 26, 2007 16:49

Hello,

Toute page crawlée par Google est-elle indexée ?

Dans quel délai une page crawlée est-elle visible dans l'index de Google ?


Leonick
WRInaute accro
WRInaute accro
 
Messages: 19595
Inscription: 8 Aoû 2004

Re: Pages crawlées et pages indexées

Message le Jeu Avr 26, 2007 17:12

pooxeur a écrit:Toute page crawlée par Google est-elle indexée ?
non
pooxeur a écrit:Dans quel délai une page crawlée est-elle visible dans l'index de Google ?
on ne sait pass. Des fois quelques mois ou années plus tard


pooxeur
WRInaute discret
WRInaute discret
 
Messages: 231
Inscription: 23 Déc 2004

Message le Jeu Avr 26, 2007 19:11

Je ne suis pas d'accord.

Pour moi toute page crawlée, se retrouve indexée et dans un délai assez rapide (< à 10 jours)...

Quelqu'un a-t-il un contre-exemple ?


HawkEye
WRInaute accro
WRInaute accro
 
Messages: 17013
Inscription: 23 Fév 2004

Message le Jeu Avr 26, 2007 21:36

pooxeur a écrit:Quelqu'un a-t-il un contre-exemple ?


...toutes les pages crawlées sur lesquelles il y'a un <meta name="robots" content="none">, et toutes les pages crawlées qui sont en "Disallow" via robots.txt :)

A part ça oui, tout document crawlé finit à terme par être indexé, pas forcément en 24h néanmoins.


pooxeur
WRInaute discret
WRInaute discret
 
Messages: 231
Inscription: 23 Déc 2004

Message le Ven Avr 27, 2007 15:20

Faux, même un document avec un Disallow est crawlé et indéxée ;)

La preuve :
http://www.kewego.fr/robots.txt
contient
User-agent: *
Disallow: /tos/

Et pourtant la page /tos/ est crawlée et indéxée :
http://www.google.fr/search?q=site%3Aww ... ch&start=0

Qu'en pensez-vous ?


Leonick
WRInaute accro
WRInaute accro
 
Messages: 19595
Inscription: 8 Aoû 2004

Message le Ven Avr 27, 2007 15:56

pooxeur a écrit:Et pourtant la page /tos/ est crawlée et indéxée
non, elle n'a pas été crawlé, la preuve il y a juste affiché "pages similaires" et non page en cache ni le descriptif.
En plus, cette recherche ne donne rien http://www.google.fr/search?hl=fr&q=dis ... DcountryFR alors que ce terme apparait plusieurs fois dans la page


pooxeur
WRInaute discret
WRInaute discret
 
Messages: 231
Inscription: 23 Déc 2004

Message le Ven Avr 27, 2007 16:55

Effectivement, en fait, elle est bien indéxée (le lien) mais pas crawlée....


pooxeur
WRInaute discret
WRInaute discret
 
Messages: 231
Inscription: 23 Déc 2004

Message le Ven Avr 27, 2007 16:56

Et visiblement elle a un gros pagerank ? Curieux ?

daftclub06
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 23
Inscription: 28 Fév 2007

Message le Ven Avr 27, 2007 18:28

pooxeur a écrit:Je ne suis pas d'accord.

Pour moi toute page crawlée, se retrouve indexée et dans un délai assez rapide (< à 10 jours)...

Quelqu'un a-t-il un contre-exemple ?


Oui j'ai un trés bon contre exemple

J'ai posté une sitemap de 3000 URLs sur google , certaines pages ont été crawlées il y a plus de deux mois et ne sont toujours pas dans l'index

Dans mon cas google crawle environ 200 pages par semaine et en moyenne une seule de ces 200 pages apparait dans l'index par semaine .......

A ce rythme là , mon site sera indexé dans un peu moins de 60 ans d'après mes calculs .... 8O


Monty973
WRInaute passionné
WRInaute passionné
 
Messages: 1636
Inscription: 21 Mar 2006

Message le Ven Avr 27, 2007 18:38

pooxeur a écrit:Effectivement, en fait, elle est bien indéxée (le lien) mais pas crawlée....


pooxeur a écrit:Et visiblement elle a un gros pagerank ? Curieux ?


Ca s'apelle des "pages partiellement indexées" chez Google :
http://www.google.com/support/webmaster ... swer=35667

et des "thin documents" chez Yahoo! :
http://help.yahoo.com/help/us/ysearch/s ... rp-01.html

Les META robots n'empêche pas l'indexation par Yahoo! mais doit en théorie éviter l'indexation par Google.

Sinon pour les désindexer, il faut utiliser leurs outils de supression d'URLs

daftclub06
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 23
Inscription: 28 Fév 2007

Message le Mer Mai 02, 2007 12:37

HawkEye a écrit:
pooxeur a écrit:Quelqu'un a-t-il un contre-exemple ?


...toutes les pages crawlées sur lesquelles il y'a un <meta name="robots" content="none">, et toutes les pages crawlées qui sont en "Disallow" via robots.txt :)

A part ça oui, tout document crawlé finit à terme par être indexé, pas forcément en 24h néanmoins.


Et si au bout de deux mois il n'est pas indexe , tu crois qu'il faut que je m'inquiete.

Si quelqu'un pouvait prendre 5 minutes de son temps pour analyser le pourquoi du comment concernant mon site, je lui en serais eternellement reconnaissant :)

http://www.chila-audio.com


Si vous avez aimé cette discussion, partagez-la sur vos réseaux sociaux préférés :

Formation recommandée sur ce thème :

Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :

Consultez la description détaillée des produits ou services de Google suivants : Google API, Google Sitemaps

  • Bilan du référencement Google
    Cet outil vous donne un petit résumé de l'état de référencement de votre site dans Google.
  • Similarité et duplicate content
    Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages). Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation... Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués.
  • Calculer le ratio de liens profonds
    Cet outil vous permet de calculer le taux de liens profonds vers un site web. Un lien profond est un lien qui ne pointe pas vers la page d'accueil mais au contraire vers une page interne du site. Les sites dont l'essentiel du référencement vient de leurs inscriptions dans des annuaires ont un taux de liens profonds faible ; à l'inverse, les sites de référence ont souvent un taux de liens profonds plus important, signe que leur contenu a suscité de nombreux liens spontanés.


Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités