Trop de scan des robots
14 messages
• Page 1 sur 1
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
- XGilbert
- WRInaute discret

- Messages: 219
- Inscription: 10 Avr 2007
Trop de scan des robots
Bonjour,
Voici mon problème :
J'ai plusieurs sites avec beaucoup de contenu (certains avec environ 70.000 pages).
Aujourd'hui, j'avais plus de 15 robots qui scannaient mes pages, ils ont scannés plus de 900.000 pages rien qu'a eux.
Je n'ai pas autant de visites d'internautes, mais les moteurs me bouffent toutes les ressources du serveur, et cela arrive pratiquement tout les jours.
Y'a t-i-l un moyen pour "limiter" le nombre de pages vue par les robots, ou un moyen pour que cela me prennent moins de ressources et moins de bande passante ?
Dans GWT, je sais que l'on peut baisser la demande d'exploration du site par le robot, mais pour les autres moteurs ?
Cela est-il néfaste pour le référencement ?
Merci pour vos réponses ou vos retours d'expériences sur ce sujet.
Voici mon problème :
J'ai plusieurs sites avec beaucoup de contenu (certains avec environ 70.000 pages).
Aujourd'hui, j'avais plus de 15 robots qui scannaient mes pages, ils ont scannés plus de 900.000 pages rien qu'a eux.
Je n'ai pas autant de visites d'internautes, mais les moteurs me bouffent toutes les ressources du serveur, et cela arrive pratiquement tout les jours.
Y'a t-i-l un moyen pour "limiter" le nombre de pages vue par les robots, ou un moyen pour que cela me prennent moins de ressources et moins de bande passante ?
Dans GWT, je sais que l'on peut baisser la demande d'exploration du site par le robot, mais pour les autres moteurs ?
Cela est-il néfaste pour le référencement ?
Merci pour vos réponses ou vos retours d'expériences sur ce sujet.
-

agenceinternet - WRInaute passionné

- Messages: 1323
- Inscription: 28 Mar 2008
Re: Trop de scan des robots
Est-ce que ton contenu change régulièrement ou bien est-ce que se sont des pages statiques ?
Si c'est dynamique, je doute que se soit une bonne choses de vouloir ralentir les moteurs de recherches, vous en pensez quoi ?
Ou autrement si tu as 15 moteur différent qui sont passé, peut être voir si c'est possible de ne pas ralentir Google, Bing et Yahoo, mais que les autres... Mais là je sais pas comment est-ce qu'il faut procéder, ni même si c'est possible.
Si c'est dynamique, je doute que se soit une bonne choses de vouloir ralentir les moteurs de recherches, vous en pensez quoi ?
Ou autrement si tu as 15 moteur différent qui sont passé, peut être voir si c'est possible de ne pas ralentir Google, Bing et Yahoo, mais que les autres... Mais là je sais pas comment est-ce qu'il faut procéder, ni même si c'est possible.
-

finstreet - WRInaute accro

- Messages: 16999
- Inscription: 10 Juil 2005
Re: Trop de scan des robots
Alors ca je vais suivre avec attention. J'ai le même problème. Ils me mettent en carafe mon mysql depuis que j'ai diminué le poids de chaque page, ils mangent encore + qu'avant. Je viens de passer à la mise en cache d'une partie du site, on verra les résultats.
-

agenceinternet - WRInaute passionné

- Messages: 1323
- Inscription: 28 Mar 2008
Re: Trop de scan des robots
Ah oui, XGilbert, es-que tu utilises un système de cache ?
- XGilbert
- WRInaute discret

- Messages: 219
- Inscription: 10 Avr 2007
Re: Trop de scan des robots
agenceinternet a écrit:Est-ce que ton contenu change régulièrement ou bien est-ce que se sont des pages statiques ?
Si c'est dynamique, je doute que se soit une bonne choses de vouloir ralentir les moteurs de recherches, vous en pensez quoi ?
Ou autrement si tu as 15 moteur différent qui sont passé, peut être voir si c'est possible de ne pas ralentir Google, Bing et Yahoo, mais que les autres... Mais là je sais pas comment est-ce qu'il faut procéder, ni même si c'est possible.
Oui, le site est dynamique.
Les articles, une fois publiés ne changent pas, mais il y en a des nouveaux chaque jours.
agenceinternet a écrit:Ah oui, XGilbert, es-que tu utilises un système de cache ?
Oui, bien sur.
Sinon, on pensait avoir deux versions du site. Je m'explique. Si c'est un robot qui est détecté, on lui envoie le contenu sans le template, presque en brut, de quoi l'alimenter, en gagnant quelques ko. Qu'en pensez-vous ?
- amph37
- WRInaute occasionnel

- Messages: 279
- Inscription: 27 Fév 2007
Re: Trop de scan des robots
je te déconseille cette technique de cloacking. Tu risquerais d'être pénalisé. Rien ne t'empêcherai alors de blinder tes pages de mcls. Même si cela n'est de toute évidence pas ton intention dans ce cas.
Il faut envoyer au bot exactement le même contenu qu'au visiteurs en théorie.
Sinon tu peux peut-être n'autoriser que les bots qui te rapportent et bloquer ceux qui ne servent quasiment à rien.
Il faut envoyer au bot exactement le même contenu qu'au visiteurs en théorie.
Sinon tu peux peut-être n'autoriser que les bots qui te rapportent et bloquer ceux qui ne servent quasiment à rien.
-

agenceinternet - WRInaute passionné

- Messages: 1323
- Inscription: 28 Mar 2008
Re: Trop de scan des robots
oui dans ce cas je ne vois pas d'autres solutions qu'assumer ce gros trafic ou alors de bloquer les bot de moteur de recherche qui ne t'amène que très très peu de visiteurs... Mais je doute que ce soit une très bonne chose.
- XGilbert
- WRInaute discret

- Messages: 219
- Inscription: 10 Avr 2007
Re: Trop de scan des robots
amph37 a écrit:Sinon tu peux peut-être n'autoriser que les bots qui te rapportent et bloquer ceux qui ne servent quasiment à rien.
Le souci vient surtout des bots importants. Même en supprimant les bots secondaires, ça ne changera rien a mon problème, ces derniers ne scan que quelques dizaines de pages par jour.
On essaye encore d'optimiser le cache pour être sur que la base ne tombe pas, mais ça arrive que ça soit le serveur web qui tombe
-

agenceinternet - WRInaute passionné

- Messages: 1323
- Inscription: 28 Mar 2008
Re: Trop de scan des robots
Est-ce que c'est possible de connaitre la configuration du serveur actuel ?
Il faudrait effectivement dans ce cas voir pour un serveur plus puissant pour tenir la charge que les bots crées...
Il faudrait effectivement dans ce cas voir pour un serveur plus puissant pour tenir la charge que les bots crées...
14 messages
• Page 1 sur 1
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Trop de restriction dans le robots.txt
- Trop d'impots, trop de taxes, trop de cotisations : partir à l'étranger ?
- Scan Page rank
- Scan, Hack de site web ?
- Scan de la page? CPC? CPM?
- Sécurité - Google scan les ports ?
- Scan/Ping d'ip+port autorisé?
- Logiciel de génération PDF pour scan?
- Google Actualités : scan d'un répertoire
- Peut-on choisir l'heure de scan de google ?
- Analyse de similarité textuelle
Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages). Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation... Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités

