VoilaBot BETA 1.2
18 messages • Page 1 sur 2 • 1, 2
Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics
-

metropoway - WRInaute occasionnel

- Messages: 215
- Inscription: Mer Mar 03, 2004 13:50
VoilaBot BETA 1.2
Bonjour,
Depuis vendredi soir, nous observons une 'charge' massive et en règle de VoilaBot sur notre serveur : 3 I.P différentes et simultanées qui génèrent un max de requêtes.
Sur le principe, pas de problème... puisque c'est quand même le but de faire des sites indexables et indexés.
Là, on peut imaginer, vu le nombres de requêtes qu'il arrive à aller voir bien en profondeur du site ; Ce qui est plutôt rassurant.
Par contre, où c'est pas cool, c'est que cela augmente très considérablement la charge de nos machines au point de les saturer
On a même du modifier le robots.txt pour calmer un peu les choses momentanément.
Est-ce que quelqu'un observe la même chose sur son site en ce moment ?
Est-ce que Voilà procède à une - TRÈS GROSSE - mise à jour de sa base ?
Bref, est-ce qu'il se passe quelque chose de particuliers chez Orange / Voilà ?
Merci
Depuis vendredi soir, nous observons une 'charge' massive et en règle de VoilaBot sur notre serveur : 3 I.P différentes et simultanées qui génèrent un max de requêtes.
Sur le principe, pas de problème... puisque c'est quand même le but de faire des sites indexables et indexés.
Là, on peut imaginer, vu le nombres de requêtes qu'il arrive à aller voir bien en profondeur du site ; Ce qui est plutôt rassurant.
Par contre, où c'est pas cool, c'est que cela augmente très considérablement la charge de nos machines au point de les saturer
On a même du modifier le robots.txt pour calmer un peu les choses momentanément.
Est-ce que quelqu'un observe la même chose sur son site en ce moment ?
Est-ce que Voilà procède à une - TRÈS GROSSE - mise à jour de sa base ?
Bref, est-ce qu'il se passe quelque chose de particuliers chez Orange / Voilà ?
Merci
Même combat, pas de solution
Bonjour,
Il y a quelques semaines, VoilaBot nous a saturé un dédié et a généré un nombre considérable de liens erronés sur leur base (24000 pages indexées pour un site qui doit en compter 1000 au max). La commande sur voila.fr, c'est domain:http://www.monsite.com
En surveillant les erreurs 404, j'ai découvert qu'il avait créé des tas de pages "virtuelles" type /123/456/789/123/Page au lieu de /123/Page.
A mon avis il y a un souci dans la gestion des redirections.
Est-ce qu'on peut vider le cache du moteur en effaçant toutes ces pages ? Peut-être avec robots.txt... Y'a-t-il des spécialistes de Voila dans la salle ?
Il y a quelques semaines, VoilaBot nous a saturé un dédié et a généré un nombre considérable de liens erronés sur leur base (24000 pages indexées pour un site qui doit en compter 1000 au max). La commande sur voila.fr, c'est domain:http://www.monsite.com
En surveillant les erreurs 404, j'ai découvert qu'il avait créé des tas de pages "virtuelles" type /123/456/789/123/Page au lieu de /123/Page.
A mon avis il y a un souci dans la gestion des redirections.
Est-ce qu'on peut vider le cache du moteur en effaçant toutes ces pages ? Peut-être avec robots.txt... Y'a-t-il des spécialistes de Voila dans la salle ?
Bonjour,
Problématique 1 : Charge massive de VOILA BOT ? Que se passe t'il à Orange/Voila?
Le moteur de recherche Orange / Voila s'est donné un objectif de croissance très important cette année. Pour cela, une infrastructure conséquente a été mise en place (doublement des machines cette année) et un nouvel outil de complément a été ajouté pour palier au manque de couverture en profondeur de certains sites. La combinaison de ces deux paramètres expliquent la charge "plus importante" des robots VOILA.
Problématique 2 : VoilaBot crée des urls relatives n'existant pas
Ceci etait un bug (une fonction de ré-écriture des URL absolues) et a été corrigé.
Merci !
Problématique 1 : Charge massive de VOILA BOT ? Que se passe t'il à Orange/Voila?
Le moteur de recherche Orange / Voila s'est donné un objectif de croissance très important cette année. Pour cela, une infrastructure conséquente a été mise en place (doublement des machines cette année) et un nouvel outil de complément a été ajouté pour palier au manque de couverture en profondeur de certains sites. La combinaison de ces deux paramètres expliquent la charge "plus importante" des robots VOILA.
Problématique 2 : VoilaBot crée des urls relatives n'existant pas
Ceci etait un bug (une fonction de ré-écriture des URL absolues) et a été corrigé.
Merci !
-

SpeedAirMan - WRInaute accro

- Messages: 1419
- Inscription: Ven Juin 01, 2007 23:22
Je trouve quand même exagéré que des robots censés indexer des sites web provoquent des surcharges entrainant ralentissement voire plantage. A quoi ça sert d'être bien référencé si le site est HS ou très difficile d'accès due à une lenteur excessive ?
Je ne parle pas de mon expérience : je n'ai pas vérifié mes sites par rapport à votre nouveau défricheur, mais au vu de ces premières remarques, ça fait peur !
De là à ce que des webmasteurs bloquent l'accès aux robots de Voila...
Voilà matière à réfléchir
Je ne parle pas de mon expérience : je n'ai pas vérifié mes sites par rapport à votre nouveau défricheur, mais au vu de ces premières remarques, ça fait peur !
De là à ce que des webmasteurs bloquent l'accès aux robots de Voila...
Voilà matière à réfléchir
- greatpatton
- WRInaute occasionnel

- Messages: 168
- Inscription: Lun Avr 03, 2006 12:53
Je pense qu'il s'agit d'un problème de règlage de la vitesse des bots qui a du s'embaler un peu...
Par contre vu le taux de visite actuel de voilà sur mes sites, ils peuvent y aller un moment
pour le moment on dirait la "web archive"
A part ça, je ne connaissais pas la commande domain sur voilà, mais le résultat est assez amusant, sur tous mes domaines testés j'avais des résultats de type indéxation aléatoire, c'est à dire des pages complétement décorrélées entre elles ou alors y a une limite à 6 réponses
Par contre vu le taux de visite actuel de voilà sur mes sites, ils peuvent y aller un moment
A part ça, je ne connaissais pas la commande domain sur voilà, mais le résultat est assez amusant, sur tous mes domaines testés j'avais des résultats de type indéxation aléatoire, c'est à dire des pages complétement décorrélées entre elles ou alors y a une limite à 6 réponses
Boucle VoilaBot
Bonjour,
Idem, depuis 2 jours, VoilaBot nous prend la moitité de notre CPU Usage sur un serveur dédié.
Il appelle les pages en raffales et boucle sur beaucoup d'elle (surtout celle qui contienne un formulaire login/mot de passe) .
Les accès MySql ont donc explosé ...
Comme dit précédemment, il tente l'indexation d' URL soient périmés soit inexistantes.
Mis a part le bloqué au niveau du htacess, voyez-vous une autre solution ?
Ci-dessous le log du Bot :
VoilaBotCollector BETA 0.1 (http://www.voila.com/)
Il nous a fait 130 000 hits en 6h !
A+
Idem, depuis 2 jours, VoilaBot nous prend la moitité de notre CPU Usage sur un serveur dédié.
Il appelle les pages en raffales et boucle sur beaucoup d'elle (surtout celle qui contienne un formulaire login/mot de passe) .
Les accès MySql ont donc explosé ...
Comme dit précédemment, il tente l'indexation d' URL soient périmés soit inexistantes.
Mis a part le bloqué au niveau du htacess, voyez-vous une autre solution ?
Ci-dessous le log du Bot :
VoilaBotCollector BETA 0.1 (http://www.voila.com/)
Il nous a fait 130 000 hits en 6h !
A+
-

Topsitemaker - WRInaute impliqué

- Messages: 373
- Inscription: Dim Nov 19, 2006 0:47
Idem de mon coté,
VoilaBot nous charge un serveur dédié en période Noël, quel belle idée de faire cela maintenant...
s'il y a la moindre couille, c'est blacklistage direct.
VoilaBot nous charge un serveur dédié en période Noël, quel belle idée de faire cela maintenant...
s'il y a la moindre couille, c'est blacklistage direct.
C'est vrai que le Voilabot a des pointes d'activité assez sévères mais cela ne dure pas trop, il semble redevenir raisonnable ensuite (inférieur à Slurp en tout cas)
Il lit sans arrêt robots.txt, j'ai plus d'accès de sa part à robots.txt qu'à tous les autres fichiers réunis. Heureusement, que les autres bots ne font pas cela!
Il lit sans arrêt robots.txt, j'ai plus d'accès de sa part à robots.txt qu'à tous les autres fichiers réunis. Heureusement, que les autres bots ne font pas cela!
-

Topsitemaker - WRInaute impliqué

- Messages: 373
- Inscription: Dim Nov 19, 2006 0:47
A croire qu'ils le font exprès
Ils ont foutu la sauce ce soir ...
et hop blacklisté au moins pour les vacances.
Ils ont foutu la sauce ce soir ...
et hop blacklisté au moins pour les vacances.
bonjour,
j'ai le meme soucis, sauf qu'il me plante le serveur en error 500.
j'ai tenté un robots.txt contenant
mais ca ne marche pas, ce n'est pas la bonne syntaxe ?
j'ai le meme soucis, sauf qu'il me plante le serveur en error 500.
j'ai tenté un robots.txt contenant
- Code: Tout sélectionner
User-agent: Mozilla/5.0 (Windows; U; Windows NT 5.1; fr; rv:1.8.1) VoilaBot BETA 1.2 (http://www.voila.com/)
Disallow: /
mais ca ne marche pas, ce n'est pas la bonne syntaxe ?
18 messages • Page 1 sur 2 • 1, 2
Formation recommandée sur ce thème :
Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Forum WebRankInfo : un membre du moteur de recherche Voila.fr vient discuter
- Google Toolbar 2.0 (version beta)
- Google News sort de sa version bêta
- Google Chrome : nouvelle version beta plus rapide
- Sortie des Google Groups 2
- Web Rank Info ouvre un forum dédié à MSN Search
- Google AdWords Editor
- Alexa se met à la recherche avec Google
- Liste de quelques poissons d'avril en 2006
- Google met à jour sa recherche locale
Consultez la description détaillée des produits ou services de Google suivants : Google AdWords Editor
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités





le forum