Premiers passages du Deep Crawler - C'est parti !
59 messages
• Page 1 sur 4 • 1, 2, 3, 4
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
-

hetzeld - WRInaute passionné

- Messages: 2209
- Inscription: 2 Déc 2002
Premiers passages du Deep Crawler - C'est parti !
Salut à tous,
Première trace chez moi cette nuit à 2H40 d'un crawler 216.239.46.102
Une seule page, mais c'est le signe que le deep crawl a commencé.
Dans les minute qui suivaient...
...chez mon pote, http://www.cadrissimo.fr, indexation totale cette nuit par les deepcrawlers
Je ne sais pas si les deepcrawlers suivent les liens sortant prioritairement, mais on dirait vraiment qu'il a indexé ma page d'accueil, suivi le seul lien sortant sur celle-ci et atterri chez le copain
L' IP chez moi est la même que celle qui a débuté chez lui, 2 minutes plus tard...
Dan
Première trace chez moi cette nuit à 2H40 d'un crawler 216.239.46.102
Une seule page, mais c'est le signe que le deep crawl a commencé.
Dans les minute qui suivaient...
...chez mon pote, http://www.cadrissimo.fr, indexation totale cette nuit par les deepcrawlers
Je ne sais pas si les deepcrawlers suivent les liens sortant prioritairement, mais on dirait vraiment qu'il a indexé ma page d'accueil, suivi le seul lien sortant sur celle-ci et atterri chez le copain
L' IP chez moi est la même que celle qui a débuté chez lui, 2 minutes plus tard...
Dan
-

WebRankInfo - Administrateur du site

- Messages: 19420
- Inscription: 19 Avr 2002
ça y est !!!
120 pages de mon côté
120 pages de mon côté
-

eric - WRInaute discret

- Messages: 72
- Inscription: 6 Nov 2002
Moi aussi enfin ... mon changement d'hébergement n'a finalement pas été fatal. Ouufff !
1 viste à 2h55
et 4 entre 8h24 et 8h27
par
216.239.46.100
216.239.46.121
216.239.46.220
216.239.46.27
... et ça continue !
Pour info et étant chez OVH, j'ai fait la modif proposée par hetzeld (désactivation du name lookup).
N'ont-ils pas été rétablis ?
Ce changement est-il définitif ?
@ +
1 viste à 2h55
et 4 entre 8h24 et 8h27
par
216.239.46.100
216.239.46.121
216.239.46.220
216.239.46.27
... et ça continue !
Pour info et étant chez OVH, j'ai fait la modif proposée par hetzeld (désactivation du name lookup).
N'ont-ils pas été rétablis ?
Ce changement est-il définitif ?
@ +
Dernière édition par eric le Jeu Fév 06, 2003 8:57, édité 1 fois.
-

hetzeld - WRInaute passionné

- Messages: 2209
- Inscription: 2 Déc 2002
Salut Olivier,
Le crawler a visité la page vers laquelle je fais un lien vers WRI à 7H07 ce matin.
Sur cette même page, j'ai deux autres liens externes non javascript vers les agences immo (mes clients) qui ont vu débarquer le Crawler quelques minutes plus tard.
J'ai aussi sur cette même page quelques liens javascript vers les différents moteurs avec des exemples de requêtes.
Pour info, GoogleBot a atterri à quelle heure chez toi ?
Il a visité la page vers laquelle j'ai un lien vers le site "tour du monde" de luckyluk à 7H08.
Ce serait bien d'avoir les heures de passage chez Luckyluk aussi, car pour l'instant, c'est troublant!
Dan
Le crawler a visité la page vers laquelle je fais un lien vers WRI à 7H07 ce matin.
Sur cette même page, j'ai deux autres liens externes non javascript vers les agences immo (mes clients) qui ont vu débarquer le Crawler quelques minutes plus tard.
J'ai aussi sur cette même page quelques liens javascript vers les différents moteurs avec des exemples de requêtes.
Pour info, GoogleBot a atterri à quelle heure chez toi ?
Il a visité la page vers laquelle j'ai un lien vers le site "tour du monde" de luckyluk à 7H08.
Ce serait bien d'avoir les heures de passage chez Luckyluk aussi, car pour l'instant, c'est troublant!
Dan
-

sglasson - WRInaute discret

- Messages: 136
- Inscription: 16 Juil 2002
ca y est moi aussi c'est parti
Par contre, ce qui est bizarre c'est qu'il vient indexer les pages deja connu apparemment il ne suit pas les nouveaux liens mais garde les anciens liens en place, je m'explique
j'ai mis en place l'url Rewriting et la il vient indexer les pages ma_page.php?toto=1 alors que mes liens sont du type ma_page_1.html depuis + d'une semaine!!!! Or le fresh bot est passé indexe mes pages ma_page_1.html !!!
Par contre, ce qui est bizarre c'est qu'il vient indexer les pages deja connu apparemment il ne suit pas les nouveaux liens mais garde les anciens liens en place, je m'explique
j'ai mis en place l'url Rewriting et la il vient indexer les pages ma_page.php?toto=1 alors que mes liens sont du type ma_page_1.html depuis + d'une semaine!!!! Or le fresh bot est passé indexe mes pages ma_page_1.html !!!
- BDGest
- WRInaute occasionnel

- Messages: 279
- Inscription: 6 Jan 2003
J'ai exactement l même chose que toi. Le deep crawl continue a visiter mes anciens liens mais ne suit absolument pas les nouvexu mis en palce avec l'url rewriting depuis un mois
Je desespere là ....
Mes sites comptent plus de 8000 pages chacun, et il n'en a visiter qu'une dizaine ce matin. Exemple des pages qu'il a visiter ce matin :
Comment expliqué vous ça ??? D'autant plus que le lien vers la page mis en gras ci dessus (/index.php?SRC=forum) n'existe plus nul part ????
Mes sites comptent plus de 8000 pages chacun, et il n'en a visiter qu'une dizaine ce matin. Exemple des pages qu'il a visiter ce matin :
1 / 01:51:00 2
2 /faq.php 09:28:00 1
3 /forum/login.php?redirect=profile.php&mode=editprofile 09:12:00 1
4 /forum/profile.php?mode=register 04:58:00 1
5 /forum/viewforum.php?f=13 07:04:00 1
6 /forum/viewforum.php?f=2 04:31:00 1
7 /index.php?SRC=forum 05:29:00 1
8 /robots.txt 01:51:00 1
Comment expliqué vous ça ??? D'autant plus que le lien vers la page mis en gras ci dessus (/index.php?SRC=forum) n'existe plus nul part ????
Dernière édition par BDGest le Jeu Fév 06, 2003 9:35, édité 1 fois.
-

Rogers - WRInaute discret

- Messages: 219
- Inscription: 24 Jan 2003
Enfin !!!!
Le googlebot est passé aussi sur mon site. Etant donné que les fresh bots n'étaient jamais passés, je m'inquiètais de ne pas avoir celui du full crawl, mais il est bien venu, mais seulement une seule fois à 7h44 ce matin.
Le googlebot est passé aussi sur mon site. Etant donné que les fresh bots n'étaient jamais passés, je m'inquiètais de ne pas avoir celui du full crawl, mais il est bien venu, mais seulement une seule fois à 7h44 ce matin.
-

hetzeld - WRInaute passionné

- Messages: 2209
- Inscription: 2 Déc 2002
Salut à tous,
C'est normal que GoogleBot visite les anciens liens qui existaient avant l'URL rewriting, comme il les connaît.
Avec l'URL rewriting, les deux liens sont bons (l'ancien et le nouveau) et le seul risque est d'avoir les anciens ET les nouveaux dans la base, en tout cas pour une ou 2 dances
Dan
C'est normal que GoogleBot visite les anciens liens qui existaient avant l'URL rewriting, comme il les connaît.
Avec l'URL rewriting, les deux liens sont bons (l'ancien et le nouveau) et le seul risque est d'avoir les anciens ET les nouveaux dans la base, en tout cas pour une ou 2 dances
Dan
- BDGest
- WRInaute occasionnel

- Messages: 279
- Inscription: 6 Jan 2003
Oui mais le problème c'est qu'il ne va PAS DU TOUT visiter les nouveaux liens. Il fait comme si il n'analysait pas les pages. J'ai l'impression qu'il ne suit pas les liens sur les pages qu'il trouve. Il y a une limite en nombre de liens par page qu'ils visitent (notamment un forum phpbb qui contient pas mal de liens) ?
Je ne comprends plus rien. J'avais même mis certains liens en absolu pour eviter le phpsesid, etc...

Je ne comprends plus rien. J'avais même mis certains liens en absolu pour eviter le phpsesid, etc...
- sepang
- WRInaute discret

- Messages: 88
- Inscription: 26 Jan 2003
Salut a tous!
J'ai EXACTEMENT le meme problemes que les amis BDgest et Sglasson.
Moi aussi j'ai mis en place l'url rewriting ce mois ci.
Je pense qu'avec de la patience, ca passera... espérons
Bonne chance pour votre crawl a tous
Sepang
J'ai EXACTEMENT le meme problemes que les amis BDgest et Sglasson.
Moi aussi j'ai mis en place l'url rewriting ce mois ci.
Je pense qu'avec de la patience, ca passera... espérons
Bonne chance pour votre crawl a tous
Sepang
-

hetzeld - WRInaute passionné

- Messages: 2209
- Inscription: 2 Déc 2002
SGlasson, BDGest, Sepang, Bshop,
Restez cool, le crawl dure environ une semaine....
Chez moi il a visité une vingtaine de pages sur 1000. On a bien le temps parce qu'on arrivera tous en même temps à la prochaine Dance, non ?
C'est logique qu'il valide d'abord les URL qu'il connaît, vire celles qui donnent un 404 et rajoute les nouvelles après...
Je pense que n'importe quel informaticien un peu sensé aurait programmé cela de cette manière, alors vu le nombre de PhD qu'il y a chez Google...
En plus, ce n'est pas parce qu'il a VU un lien qu'il va le VISITER tout de suite... une gestion de file d'attente, vous connaissez bien le principe ?
Dan
Restez cool, le crawl dure environ une semaine....
C'est logique qu'il valide d'abord les URL qu'il connaît, vire celles qui donnent un 404 et rajoute les nouvelles après...
Je pense que n'importe quel informaticien un peu sensé aurait programmé cela de cette manière, alors vu le nombre de PhD qu'il y a chez Google...
En plus, ce n'est pas parce qu'il a VU un lien qu'il va le VISITER tout de suite... une gestion de file d'attente, vous connaissez bien le principe ?
Dan
59 messages
• Page 1 sur 4 • 1, 2, 3, 4
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Passages du Googlebot
- Sites en travaux et passages de bots
- passages de GoogleBot liés au pr: Je confirme
- Fréquences des passages du robot
- 2 passages du bot et 4 changemnts page en cache ???
- Les passages google dans gg webmaster tools
- Détecter passages googlebot avec Google Analytics ?
- Quelle est la logique des passages de GoogleBot ????
- Limiter les passages de yahoo slurp sur mon site
- Deep Index plus performant
- Calculer le ratio de liens profonds
Cet outil vous permet de calculer le taux de liens profonds vers un site web. Un lien profond est un lien qui ne pointe pas vers la page d'accueil mais au contraire vers une page interne du site. Les sites dont l'essentiel du référencement vient de leurs inscriptions dans des annuaires ont un taux de liens profonds faible ; à l'inverse, les sites de référence ont souvent un taux de liens profonds plus important, signe que leur contenu a suscité de nombreux liens spontanés. - Trouver la position de son site dans Google
Cet outil vous permet de vérifier si une ou plusieurs page(s) de votre site arrive(nt) dans les premiers résultats de Google, pour certains mots-clés recherchés. - Trouver la position de son site dans Yahoo
Cet outil vous permet de vérifier si une ou plusieurs page(s) de votre site arrive(nt) dans les premiers résultats de Yahoo, pour certains mots-clés recherchés.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités



