GoogleBot : le vrai et les faux
20 messages • Page 1 sur 2 • 1, 2
Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics
GoogleBot : le vrai et les faux
Après les faux Rubens, les faux Picasso, voilà les faux GoogleBot
Mon site a été visité par quelqu'un qui s'identifie avec Googlebot/2.1 (+http://www.google.com/bot.html), mais qui n'est, en fait, qu'un browser trafiqué! L'adresse IP du visiteur ne permet aucun doute la-dessus.
Avis donc à ceux qui disent qu'ils ont eu récemment des visites inhabituelles des Googlebot...
Jean-Luc
Mon site a été visité par quelqu'un qui s'identifie avec Googlebot/2.1 (+http://www.google.com/bot.html), mais qui n'est, en fait, qu'un browser trafiqué! L'adresse IP du visiteur ne permet aucun doute la-dessus.
Avis donc à ceux qui disent qu'ils ont eu récemment des visites inhabituelles des Googlebot...
Jean-Luc
-

achtungbaby - WRInaute accro

- Messages: 4057
- Inscription: Lun Juin 14, 2004 12:37
Comment on fait pour empêcher les aspirateurs de site ?
Car on m'a déjà "aspiré plusieurs fois" déjà...
Car on m'a déjà "aspiré plusieurs fois" déjà...
-

BadProcESs - WRInaute accro

- Messages: 2656
- Inscription: Lun Juil 28, 2003 15:58
achtungbaby a écrit:Comment on fait pour empêcher les aspirateurs de site ?
Car on m'a déjà "aspiré plusieurs fois" déjà...
Les scripts de protection existant ce base en général sur la "vitesse" de consultation des pages, un aspirateur de site étant facilement reconnaissable à sa très grande "gourmandise". Ensuite, l'ip est temporairement banni.
-

BadProcESs - WRInaute accro

- Messages: 2656
- Inscription: Lun Juil 28, 2003 15:58
Pas les robots bien codés.
Justement, si tu regarde tes logs tu verra que les robots respecte le site qu'il crawle, en ne demandant qu'une page toute les 45 secondes environ.
Justement, si tu regarde tes logs tu verra que les robots respecte le site qu'il crawle, en ne demandant qu'une page toute les 45 secondes environ.
Il y a au moins un robot qui fait plusieurs milliers de page par jour sur mon site... s'il fait une page toutes les 10 secondes, ça passe encore.
Généralement, je bloque à partir de 2 pages par secondes, sur un minimum de 100 pages.
Généralement, je bloque à partir de 2 pages par secondes, sur un minimum de 100 pages.
-

Earth Brian - WRInaute occasionnel

- Messages: 106
- Inscription: Ven Jan 09, 2004 14:38
Oui tout simplement qq qui verifie que tu ne fais pas du cloaking ...
Tu choisis le user agent que tu veux et tu te fais passer pour lui .. d'ou utilité de filtrer via ip
Tu choisis le user agent que tu veux et tu te fais passer pour lui .. d'ou utilité de filtrer via ip
ben moi quand j'utilises firefox je suis toujours avec le javascript désactivé et googlebot comme agent , au début j'avais oublié de remodifier mes paramètres mais maintenant je le laisse exprès.
on voit pas mal de trucs bizarres
on voit pas mal de trucs bizarres
BadProcESs a écrit:Pas les robots bien codés.
Justement, si tu regarde tes logs tu verra que les robots respecte le site qu'il crawle, en ne demandant qu'une page toute les 45 secondes environ.
En fait je pense que ce paramètre est très variable. Je vois très souvent entre 5 et 10 pages demandées dans la meme seconde par le vrai Googlebot. En fait je pense que le temps de remontée de page à beaucoup d'importance pour Googlebot : si ton serveur sert les pages lentement, Googlebot ralenti, et inversement.
Sinon pour en revenir aux faux Googlebot, la seule solution à peu près fiable pour les détecter reste l'IP, notamment pour ceux qui veulent exclure certains "utilisateurs" des restrictions imposées par un script anti-aspiration...
Fred
Bonjour,
Vous allez me trouver un peu « tombé de la dernière pluie »,
mais pour moi, aspirer un site, c’était pouvoir le consulter hors connexion chez soi, donc rien de dramatique. J’ai même des personnes qui m’ont-dit avoir imprimé mon site ( deux ramettes de papier couché, car imprimé au format paysage pour ne rien perdre…) c’est encore mieux qu’un petit mot dans un livre d’or.
Mais à voir vos messages, aspirer un site ne doit pas servir qu’à ça ! Alors, ils en font quoi des pages aspirées ?
TC
Vous allez me trouver un peu « tombé de la dernière pluie »,
mais pour moi, aspirer un site, c’était pouvoir le consulter hors connexion chez soi, donc rien de dramatique. J’ai même des personnes qui m’ont-dit avoir imprimé mon site ( deux ramettes de papier couché, car imprimé au format paysage pour ne rien perdre…) c’est encore mieux qu’un petit mot dans un livre d’or.
Mais à voir vos messages, aspirer un site ne doit pas servir qu’à ça ! Alors, ils en font quoi des pages aspirées ?
TC
-

mahefarivony - WRInaute accro

- Messages: 11405
- Inscription: Lun Oct 14, 2002 10:00
quel interet pourrait avoir une société commerciale d'aspirer les sites webs ? 
20 messages • Page 1 sur 2 • 1, 2
Formation recommandée sur ce thème :
Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- La danse de Googlebot :-) La Google Dance
- Liens et référencement : techniques de base
- Etude de Googlebot, le robot d'indexation de Google
- Googlebot analyse certains codes JavaScript
- Etude de Googlebot, le robot crawler de Google (Fresh Bot, Deep Bot)
- Le Full Crawl a enfin commencé
- Les adresses IP de Google et Googlebot
- La Google Dance existe-elle encore ?
- Présentation de l'indexation Google - Googlebot, le robot de Google
- Configurer les options de passage de Googlebot sur son site
Consultez la description détaillée des produits ou services de Google suivants : Googlebot
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités








le forum