amazonaws.com : c’est quoi exactement ?
8 messages
• Page 1 sur 1
Consultez la formation à Google Analytics de WebRankInfo / Ranking Metrics
-

hibou57 - WRInaute passionné

- Messages: 1152
- Inscription: 1 Nov 2006
amazonaws.com : c’est quoi exactement ?
Hello,
amazonaws.com, c’est censé être un service de cloud‑computing. Mais alors pourquoi crawl t‑il ?
Il utilise beaucoup d’IPs de plages apparemment assez différentes, dont certaines IPs que j’ai relevé pour avoir des comportements pas clair, tandis que certaines IPs ne posent pas de problème; mais comme plusieurs se sont montré pas claires, je bloque toutes les IPs attachées à ce domaine.
J’aimerais quand‑même comprendre ce que c’est que cette chose.
Quelqu’un(e) en sait plus ? C’est un moteur de recherche expérimentale ou je ne sais quoi ? Ce sont des serveurs depuis lesquels n’importe qui peut faire n’importe quoi ?
Remarque : il n’apparait jamais directement comme amazonaws.com, mais plutôt avec un préfixe, les domaines apparaissent donc plutôt comme des *.*.amazonaws.com, comme par exemple ec2-50-19-70-41.compute-1.amazonaws.com.
amazonaws.com, c’est censé être un service de cloud‑computing. Mais alors pourquoi crawl t‑il ?
Il utilise beaucoup d’IPs de plages apparemment assez différentes, dont certaines IPs que j’ai relevé pour avoir des comportements pas clair, tandis que certaines IPs ne posent pas de problème; mais comme plusieurs se sont montré pas claires, je bloque toutes les IPs attachées à ce domaine.
J’aimerais quand‑même comprendre ce que c’est que cette chose.
Quelqu’un(e) en sait plus ? C’est un moteur de recherche expérimentale ou je ne sais quoi ? Ce sont des serveurs depuis lesquels n’importe qui peut faire n’importe quoi ?
Remarque : il n’apparait jamais directement comme amazonaws.com, mais plutôt avec un préfixe, les domaines apparaissent donc plutôt comme des *.*.amazonaws.com, comme par exemple ec2-50-19-70-41.compute-1.amazonaws.com.
-

hibou57 - WRInaute passionné

- Messages: 1152
- Inscription: 1 Nov 2006
Re: amazonaws.com : c’est quoi exactement ?
Mais ce n’est pas pour les données le cloud ? Qu’on puisse y stocker un programme, je me doutais bien, mais l’y faire tourner, je ne savais pas.
Du point de vue utilisateur, ce sont des serveurs à part‑entière alors ?
Du point de vue utilisateur, ce sont des serveurs à part‑entière alors ?
-

hibou57 - WRInaute passionné

- Messages: 1152
- Inscription: 1 Nov 2006
Re: amazonaws.com : c’est quoi exactement ?
Pourquoi ils font ça ? Pour la détection du cloaking ? Mais pourquoi ne pas utiliser d’autres serveurs plutôt que ceux là, dont plusieurs IPs sont connu pour spammer ?
Comment as‑tu sut que Google utilise leurs serveurs ?
Si c’est pour la détection du cloaking, j’imagine qu’on ne peut pas connaitre ces IPs. Ben tant‑pis, parfois Google recevra des erreurs 403. Si il n’y a aucun moyen de faire la distinction, que faire ?
Comment as‑tu sut que Google utilise leurs serveurs ?
Si c’est pour la détection du cloaking, j’imagine qu’on ne peut pas connaitre ces IPs. Ben tant‑pis, parfois Google recevra des erreurs 403. Si il n’y a aucun moyen de faire la distinction, que faire ?
-

hibou57 - WRInaute passionné

- Messages: 1152
- Inscription: 1 Nov 2006
Re: amazonaws.com : c’est quoi exactement ?
Trouvé ça, mais qui n’aide pas beaucoup : amazonaws.com plays host to wide variety of bad bots (webmasterworld.com)
Ça parle vers la fin, d’IPs qui quand on les ouvre, renvoient une page identique à la page d’accueil de Google. J’ai testé l’IP indiquée (--http://72.44.61.194) mais je n’obtiens rien. Bizarre cette histoire.
-- edit --
Peut‑être en rapport, en tous les cas, lié depuis le lien précédent : Hunting Google Safebrowsing Diagnostic Spidering (webmasterworld.com).
Ça parle de Google qui crawl sans apparaitre comme Google. Mais quelqu’un exprime des doutes et dit que ça pourrait être n’importe qui ou n’importe quoi d’autre.
Ça parle vers la fin, d’IPs qui quand on les ouvre, renvoient une page identique à la page d’accueil de Google. J’ai testé l’IP indiquée (--http://72.44.61.194) mais je n’obtiens rien. Bizarre cette histoire.
-- edit --
Peut‑être en rapport, en tous les cas, lié depuis le lien précédent : Hunting Google Safebrowsing Diagnostic Spidering (webmasterworld.com).
Ça parle de Google qui crawl sans apparaitre comme Google. Mais quelqu’un exprime des doutes et dit que ça pourrait être n’importe qui ou n’importe quoi d’autre.
-

Leonick - WRInaute accro

- Messages: 19590
- Inscription: 8 Aoû 2004
Re: amazonaws.com : c’est quoi exactement ?
les petits malins qui tentent de se faire passer pour googlebot à partir d'ip résidentielles ou de serveur mutualisés, ça a toujours exister. Après, c'est à chacun de ne pas se faire avoir : c'est sur que si sa seule protection est de se fier au UA
moi je parlais en fait de plages d'ip, clairement définies dans les whois comme appartenant à google ou à amazon, mais tous les 2 hébergent des applications externes; googleapps sert ainsi de nid à de nombreux bots sauvages et là, impossible de bloquer les ip, car google preview ou translate utilise aussi ces ip. Il semblerait que google force le user agent, qui contiendra toujours un google apps dedans, il suffit, dans ce cas de bloquer le UA
moi je parlais en fait de plages d'ip, clairement définies dans les whois comme appartenant à google ou à amazon, mais tous les 2 hébergent des applications externes; googleapps sert ainsi de nid à de nombreux bots sauvages et là, impossible de bloquer les ip, car google preview ou translate utilise aussi ces ip. Il semblerait que google force le user agent, qui contiendra toujours un google apps dedans, il suffit, dans ce cas de bloquer le UA
-

hibou57 - WRInaute passionné

- Messages: 1152
- Inscription: 1 Nov 2006
Re: amazonaws.com : c’est quoi exactement ?
C’est sûr que se fier au seul User‑Agent n’est pas malin. J’utilise d’autres critères, multiples, mais le User‑Agent en fait partie, d’une certaine manière.
Merci pour la note au sujet de l’UA GoogleApps.
De toutes manières, j’ai prévu de mettre la page d’erreur 403 sous surveillance aussi, pour voir si je ne fais pas d’erreur.
amazonaws.com est parfois associé à des IPs en Russie. Peut‑être que la provenance reste plus significative que le domaine. Ça, je le verrai dans plusieurs jours, en décortiquant les logs de la page 403.
Merci encore pour tes commentaires bien précieux
Merci pour la note au sujet de l’UA GoogleApps.
De toutes manières, j’ai prévu de mettre la page d’erreur 403 sous surveillance aussi, pour voir si je ne fais pas d’erreur.
amazonaws.com est parfois associé à des IPs en Russie. Peut‑être que la provenance reste plus significative que le domaine. Ça, je le verrai dans plusieurs jours, en décortiquant les logs de la page 403.
Merci encore pour tes commentaires bien précieux
8 messages
• Page 1 sur 1
Formation recommandée sur ce thème :
Formation Google Analytics : en 2 jours, apprenez comment exploiter l'essentiel des possibilités de l'outil de mesure d'audience de Google. Formation animée par les experts Google Analytics de Ranking Metrics.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- franchement, cest enervant
- Cest utile de faire des description de pages differentes ?
- keywords ... combien exactement ?
- Que fait exactement la recommandation?
- Comment savoir exactement?
- backlinks ? Comment ça marche exactement ?
- [Surprise] 14/02/09 ; 00:31:30 il sera exactement 1234567890
- Que signifie exactement sous-hebergement ?
- Les Ancres : c'est quoi exactement ?
- definition du buzzzz ? [c'est quoi exactement?]
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 1 invité

