UserAgent "C4PC UserAgent/0.7"
5 messages
• Page 1 sur 1
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
- 3ul3r
- WRInaute discret

- Messages: 84
- Inscription: 22 Fév 2009
UserAgent "C4PC UserAgent/0.7"
Bonjour à tous,
Depuis 2 jours, j'observe un utilisateur/robot qui essai de charger toutes les pages et tous les fichiers de mon site. Le "crawl" se fait dans la douceur, environ 15 pages par heure, mais il ne s'arrête jamais...
Mes logs me disent que l'useragent utilisé est "C4PC UserAgent/0.7" et l'IP 91.121.4.63
J'ai trouvé quelques maigres infos sur l'IP : c'est un serveur dédié chez OVH.
Mais je n'arrive pas à trouver d'info sur l'useragent.
PS : par prudence, j'ai bloqué l'IP ce matin (j'ai plein de contenu non-libre de diffusion sur mon site, donc j'aime pas qu'on "aspire" sans raison valable). Les pages ont continué d'être chargées, générant plein d'erreurs 403 (ce qui est logique).
Vous avez déjà vu ça ?
Depuis 2 jours, j'observe un utilisateur/robot qui essai de charger toutes les pages et tous les fichiers de mon site. Le "crawl" se fait dans la douceur, environ 15 pages par heure, mais il ne s'arrête jamais...
Mes logs me disent que l'useragent utilisé est "C4PC UserAgent/0.7" et l'IP 91.121.4.63
J'ai trouvé quelques maigres infos sur l'IP : c'est un serveur dédié chez OVH.
Mais je n'arrive pas à trouver d'info sur l'useragent.
PS : par prudence, j'ai bloqué l'IP ce matin (j'ai plein de contenu non-libre de diffusion sur mon site, donc j'aime pas qu'on "aspire" sans raison valable). Les pages ont continué d'être chargées, générant plein d'erreurs 403 (ce qui est logique).
Vous avez déjà vu ça ?
-

guicara - WRInaute passionné

- Messages: 2472
- Inscription: 2 Fév 2006
Re: UserAgent "C4PC UserAgent/0.7"
Tu n'est apparemment pas le seul : http://www.webmasterworld.com/search_engine_spiders/4174134.htm
Il s'agirait peut être de cloud4search.com (domaine français réservé chez Gandi et hébergé sur un dédié - peut être chez OVH).
EDIT : viendrait plus précisément de search.cloudsearch.com
Il s'agirait peut être de cloud4search.com (domaine français réservé chez Gandi et hébergé sur un dédié - peut être chez OVH).
EDIT : viendrait plus précisément de search.cloudsearch.com
- 3ul3r
- WRInaute discret

- Messages: 84
- Inscription: 22 Fév 2009
Re: UserAgent "C4PC UserAgent/0.7"
J'avais trouvé la même page de forum que tu cites, mais on n'apprend malheureusement pas grand chose de plus :/
En tout cas, ca n'a donc rien à voir avec les services d'OVH.
Mon site étant sur un mutu OVH, je m'étais demandé si ce n'était pas un robot qui appartenait à OVH, servant à vérifier l'uptime des sites par exemple ... et donc un robot qu'il ne fallait pas bloquer.
J'ai fait un tour sur search.cloudsearch.com et cloudsearch.com ce sont des domaines en parking, donc je comprends pas trop à quoi bon ils utilisent un robot d'indexation (en supposant qu'il indexe ...)
En tout cas, ca n'a donc rien à voir avec les services d'OVH.
Mon site étant sur un mutu OVH, je m'étais demandé si ce n'était pas un robot qui appartenait à OVH, servant à vérifier l'uptime des sites par exemple ... et donc un robot qu'il ne fallait pas bloquer.
J'ai fait un tour sur search.cloudsearch.com et cloudsearch.com ce sont des domaines en parking, donc je comprends pas trop à quoi bon ils utilisent un robot d'indexation (en supposant qu'il indexe ...)
- 3ul3r
- WRInaute discret

- Messages: 84
- Inscription: 22 Fév 2009
Re: UserAgent "C4PC UserAgent/0.7"
Nouvelles du front.
Après une journée de repos, le robot/crawler est revenu ... mais avec d'autres identificateur.
L'IP est maintenant 91.121.20.133 et l'useragent "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0;)"
Je sais que c'est le même bot, parce que beaucoup de coïncidence sont présentes :
- même plage d'IP (le whois donne le même host : search4.cloud4search.com, et dit que c'est également un dédié chez OVH)
- même navigation dans le site : une 15ène de chargement de page par heure, tout au long de la journée, sans aucune cohérence dans la suite des pages chargées
- un useragent qui indique IE 6.0, typiquement un "vieux" aspirateur de site qui veut se faire passer pour un internaute lambda.
Ce qui est intéressant maintenant, ca serait de savoir si un humain a du intervenir sur ce crawler pour modifier l'user-agent/l'IP ... et puis pourquoi il s'acharne toujours à essayer d'indexer (?) tout mon site.
Si vous avez des idées ...
Après une journée de repos, le robot/crawler est revenu ... mais avec d'autres identificateur.
L'IP est maintenant 91.121.20.133 et l'useragent "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0;)"
Je sais que c'est le même bot, parce que beaucoup de coïncidence sont présentes :
- même plage d'IP (le whois donne le même host : search4.cloud4search.com, et dit que c'est également un dédié chez OVH)
- même navigation dans le site : une 15ène de chargement de page par heure, tout au long de la journée, sans aucune cohérence dans la suite des pages chargées
- un useragent qui indique IE 6.0, typiquement un "vieux" aspirateur de site qui veut se faire passer pour un internaute lambda.
Ce qui est intéressant maintenant, ca serait de savoir si un humain a du intervenir sur ce crawler pour modifier l'user-agent/l'IP ... et puis pourquoi il s'acharne toujours à essayer d'indexer (?) tout mon site.
Si vous avez des idées ...
5 messages
• Page 1 sur 1
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités

