Trop de scan des robots

Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics

XGilbert
WRInaute discret
WRInaute discret
 
Messages: 219
Inscription: 10 Avr 2007

Trop de scan des robots

Message le Mer Juin 02, 2010 16:58

Bonjour,
Voici mon problème :
J'ai plusieurs sites avec beaucoup de contenu (certains avec environ 70.000 pages).
Aujourd'hui, j'avais plus de 15 robots qui scannaient mes pages, ils ont scannés plus de 900.000 pages rien qu'a eux.
Je n'ai pas autant de visites d'internautes, mais les moteurs me bouffent toutes les ressources du serveur, et cela arrive pratiquement tout les jours.
Y'a t-i-l un moyen pour "limiter" le nombre de pages vue par les robots, ou un moyen pour que cela me prennent moins de ressources et moins de bande passante ?
Dans GWT, je sais que l'on peut baisser la demande d'exploration du site par le robot, mais pour les autres moteurs ?
Cela est-il néfaste pour le référencement ?
Merci pour vos réponses ou vos retours d'expériences sur ce sujet.


agenceinternet
WRInaute passionné
WRInaute passionné
 
Messages: 1323
Inscription: 28 Mar 2008

Re: Trop de scan des robots

Message le Mer Juin 02, 2010 17:41

Est-ce que ton contenu change régulièrement ou bien est-ce que se sont des pages statiques ?

Si c'est dynamique, je doute que se soit une bonne choses de vouloir ralentir les moteurs de recherches, vous en pensez quoi ?

Ou autrement si tu as 15 moteur différent qui sont passé, peut être voir si c'est possible de ne pas ralentir Google, Bing et Yahoo, mais que les autres... Mais là je sais pas comment est-ce qu'il faut procéder, ni même si c'est possible.


finstreet
WRInaute accro
WRInaute accro
 
Messages: 16999
Inscription: 10 Juil 2005

Re: Trop de scan des robots

Message le Mer Juin 02, 2010 17:42

Alors ca je vais suivre avec attention. J'ai le même problème. Ils me mettent en carafe mon mysql depuis que j'ai diminué le poids de chaque page, ils mangent encore + qu'avant. Je viens de passer à la mise en cache d'une partie du site, on verra les résultats.


agenceinternet
WRInaute passionné
WRInaute passionné
 
Messages: 1323
Inscription: 28 Mar 2008

Re: Trop de scan des robots

Message le Mer Juin 02, 2010 17:51

Ah oui, XGilbert, es-que tu utilises un système de cache ?

XGilbert
WRInaute discret
WRInaute discret
 
Messages: 219
Inscription: 10 Avr 2007

Re: Trop de scan des robots

Message le Jeu Juin 03, 2010 9:59

agenceinternet a écrit:Est-ce que ton contenu change régulièrement ou bien est-ce que se sont des pages statiques ?

Si c'est dynamique, je doute que se soit une bonne choses de vouloir ralentir les moteurs de recherches, vous en pensez quoi ?

Ou autrement si tu as 15 moteur différent qui sont passé, peut être voir si c'est possible de ne pas ralentir Google, Bing et Yahoo, mais que les autres... Mais là je sais pas comment est-ce qu'il faut procéder, ni même si c'est possible.



Oui, le site est dynamique.
Les articles, une fois publiés ne changent pas, mais il y en a des nouveaux chaque jours.

agenceinternet a écrit:Ah oui, XGilbert, es-que tu utilises un système de cache ?

Oui, bien sur.


Sinon, on pensait avoir deux versions du site. Je m'explique. Si c'est un robot qui est détecté, on lui envoie le contenu sans le template, presque en brut, de quoi l'alimenter, en gagnant quelques ko. Qu'en pensez-vous ?

amph37
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 279
Inscription: 27 Fév 2007

Re: Trop de scan des robots

Message le Jeu Juin 03, 2010 10:06

je te déconseille cette technique de cloacking. Tu risquerais d'être pénalisé. Rien ne t'empêcherai alors de blinder tes pages de mcls. Même si cela n'est de toute évidence pas ton intention dans ce cas.
Il faut envoyer au bot exactement le même contenu qu'au visiteurs en théorie.

Sinon tu peux peut-être n'autoriser que les bots qui te rapportent et bloquer ceux qui ne servent quasiment à rien.


agenceinternet
WRInaute passionné
WRInaute passionné
 
Messages: 1323
Inscription: 28 Mar 2008

Re: Trop de scan des robots

Message le Jeu Juin 03, 2010 10:11

oui dans ce cas je ne vois pas d'autres solutions qu'assumer ce gros trafic ou alors de bloquer les bot de moteur de recherche qui ne t'amène que très très peu de visiteurs... Mais je doute que ce soit une très bonne chose.

XGilbert
WRInaute discret
WRInaute discret
 
Messages: 219
Inscription: 10 Avr 2007

Re: Trop de scan des robots

Message le Jeu Juin 03, 2010 11:08

amph37 a écrit:Sinon tu peux peut-être n'autoriser que les bots qui te rapportent et bloquer ceux qui ne servent quasiment à rien.


Le souci vient surtout des bots importants. Même en supprimant les bots secondaires, ça ne changera rien a mon problème, ces derniers ne scan que quelques dizaines de pages par jour.
On essaye encore d'optimiser le cache pour être sur que la base ne tombe pas, mais ça arrive que ça soit le serveur web qui tombe


OTP
Modérateur
Modérateur
 
Messages: 19532
Inscription: 16 Déc 2005

Re: Trop de scan des robots

Message le Jeu Juin 03, 2010 11:14

Se placer sur un dédié plus performant ?

amph37
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 279
Inscription: 27 Fév 2007

Re: Trop de scan des robots

Message le Jeu Juin 03, 2010 11:15

Dans ce cas, il va peut être falloir envisager de passer sur un plus gros serveur ou bien utiliser un serveur uniquement pour gérer le sql par exemple.

EDIT: bon ben grillé....


Zecat
WRInaute accro
WRInaute accro
 
Messages: 12003
Inscription: 1 Mar 2005

Re: Trop de scan des robots

Message le Jeu Juin 03, 2010 12:53

Ces temps ci chez moi c'ets cuil qui est pris de boulimie ...


agenceinternet
WRInaute passionné
WRInaute passionné
 
Messages: 1323
Inscription: 28 Mar 2008

Re: Trop de scan des robots

Message le Jeu Juin 03, 2010 14:15

Est-ce que c'est possible de connaitre la configuration du serveur actuel ?

Il faudrait effectivement dans ce cas voir pour un serveur plus puissant pour tenir la charge que les bots crées...

amph37
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 279
Inscription: 27 Fév 2007

Re: Trop de scan des robots

Message le Jeu Juin 03, 2010 14:58

Zecat a écrit:Ces temps ci chez moi c'ets cuil qui est pris de boulimie ...


En effet, Twiceler a été très présent chez moi aussi.

XGilbert
WRInaute discret
WRInaute discret
 
Messages: 219
Inscription: 10 Avr 2007

Re: Trop de scan des robots

Message le Ven Juin 04, 2010 10:17

On a divisé la charge sur deux serveurs, et le problème est réglé.
Merci pour vos réponses


Si vous avez aimé cette discussion, partagez-la sur vos réseaux sociaux préférés :

Formation recommandée sur ce thème :

Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :

  • Analyse de similarité textuelle
    Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages). Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation... Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués.


Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités