GoogleBot : le vrai et les faux
20 messages
• Page 1 sur 2 • 1, 2
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
-

jeanluc - WRInaute accro

- Messages: 3049
- Inscription: 3 Mai 2004
GoogleBot : le vrai et les faux
Après les faux Rubens, les faux Picasso, voilà les faux GoogleBot
Mon site a été visité par quelqu'un qui s'identifie avec Googlebot/2.1 (+http://www.google.com/bot.html), mais qui n'est, en fait, qu'un browser trafiqué! L'adresse IP du visiteur ne permet aucun doute la-dessus.
Avis donc à ceux qui disent qu'ils ont eu récemment des visites inhabituelles des Googlebot...
Jean-Luc
Mon site a été visité par quelqu'un qui s'identifie avec Googlebot/2.1 (+http://www.google.com/bot.html), mais qui n'est, en fait, qu'un browser trafiqué! L'adresse IP du visiteur ne permet aucun doute la-dessus.
Avis donc à ceux qui disent qu'ils ont eu récemment des visites inhabituelles des Googlebot...
Jean-Luc
-

achtungbaby - WRInaute accro

- Messages: 4066
- Inscription: 14 Juin 2004
Comment on fait pour empêcher les aspirateurs de site ?
Car on m'a déjà "aspiré plusieurs fois" déjà...
Car on m'a déjà "aspiré plusieurs fois" déjà...
-

BadProcESs - WRInaute accro

- Messages: 2657
- Inscription: 28 Juil 2003
achtungbaby a écrit:Comment on fait pour empêcher les aspirateurs de site ?
Car on m'a déjà "aspiré plusieurs fois" déjà...
Les scripts de protection existant ce base en général sur la "vitesse" de consultation des pages, un aspirateur de site étant facilement reconnaissable à sa très grande "gourmandise". Ensuite, l'ip est temporairement banni.
-

BadProcESs - WRInaute accro

- Messages: 2657
- Inscription: 28 Juil 2003
Pas les robots bien codés.
Justement, si tu regarde tes logs tu verra que les robots respecte le site qu'il crawle, en ne demandant qu'une page toute les 45 secondes environ.
Justement, si tu regarde tes logs tu verra que les robots respecte le site qu'il crawle, en ne demandant qu'une page toute les 45 secondes environ.
-

Bool - WRInaute passionné

- Messages: 1290
- Inscription: 26 Fév 2004
Il y a au moins un robot qui fait plusieurs milliers de page par jour sur mon site... s'il fait une page toutes les 10 secondes, ça passe encore.
Généralement, je bloque à partir de 2 pages par secondes, sur un minimum de 100 pages.
Généralement, je bloque à partir de 2 pages par secondes, sur un minimum de 100 pages.
-

Earth Brian - WRInaute discret

- Messages: 106
- Inscription: 9 Jan 2004
Oui tout simplement qq qui verifie que tu ne fais pas du cloaking ...
Tu choisis le user agent que tu veux et tu te fais passer pour lui .. d'ou utilité de filtrer via ip
Tu choisis le user agent que tu veux et tu te fais passer pour lui .. d'ou utilité de filtrer via ip
-

Le_Phasme - WRInaute passionné

- Messages: 1453
- Inscription: 4 Juil 2003
Si qqn veut essayer :
http://www.wannabrowser.com/
http://www.wannabrowser.com/
- iconso
- WRInaute occasionnel

- Messages: 446
- Inscription: 8 Avr 2003
BadProcESs a écrit:Pas les robots bien codés.
Justement, si tu regarde tes logs tu verra que les robots respecte le site qu'il crawle, en ne demandant qu'une page toute les 45 secondes environ.
En fait je pense que ce paramètre est très variable. Je vois très souvent entre 5 et 10 pages demandées dans la meme seconde par le vrai Googlebot. En fait je pense que le temps de remontée de page à beaucoup d'importance pour Googlebot : si ton serveur sert les pages lentement, Googlebot ralenti, et inversement.
Sinon pour en revenir aux faux Googlebot, la seule solution à peu près fiable pour les détecter reste l'IP, notamment pour ceux qui veulent exclure certains "utilisateurs" des restrictions imposées par un script anti-aspiration...
Fred
-

microbe - WRInaute discret

- Messages: 70
- Inscription: 29 Mar 2004
Bonjour,
Vous allez me trouver un peu « tombé de la dernière pluie »,
mais pour moi, aspirer un site, c’était pouvoir le consulter hors connexion chez soi, donc rien de dramatique. J’ai même des personnes qui m’ont-dit avoir imprimé mon site ( deux ramettes de papier couché, car imprimé au format paysage pour ne rien perdre…) c’est encore mieux qu’un petit mot dans un livre d’or.
Mais à voir vos messages, aspirer un site ne doit pas servir qu’à ça ! Alors, ils en font quoi des pages aspirées ?
TC
Vous allez me trouver un peu « tombé de la dernière pluie »,
mais pour moi, aspirer un site, c’était pouvoir le consulter hors connexion chez soi, donc rien de dramatique. J’ai même des personnes qui m’ont-dit avoir imprimé mon site ( deux ramettes de papier couché, car imprimé au format paysage pour ne rien perdre…) c’est encore mieux qu’un petit mot dans un livre d’or.
Mais à voir vos messages, aspirer un site ne doit pas servir qu’à ça ! Alors, ils en font quoi des pages aspirées ?
TC
-

mahefarivony - WRInaute accro

- Messages: 11405
- Inscription: 14 Oct 2002
quel interet pourrait avoir une société commerciale d'aspirer les sites webs ? 
20 messages
• Page 1 sur 2 • 1, 2
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- vrai-faux nouveau site
- Urchin : Tout faux ou un peu de vrai ?
- Mon site a un VRAI-FAUX PageRank de 7 !!!
- Vrai ou faux? Le site weecast.fr a utilisé Dreamweaver?
- Loi des 7 jours de rétractation : vrai/faux ?
- Comment faire la différence entre un faux PR et un vrai PR?
- Avoir un flux RSS améliore le référencement, vrai ou faux
- mots clefs dans .gif à la construction vrai ou faux?
- Vrai Pagerank ou Faux Pagerank ?
- Googlebot remplace Googlebot-News pour le crawl des actualités
Consultez la description détaillée des produits ou services de Google suivants : Googlebot
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités


