Risques d'un site extrayant ses données depuis google?

Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics


Podvin
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 9
Inscription: 13 Avr 2005

Risques d'un site extrayant ses données depuis google?

Message le Ven Mai 04, 2007 19:54

Bonjour,

Inspiré de ce post http://www.webrankinfo.com/forums/viewtopic_44365.htm,
j'ai réalisé un prototype d'outil de positionnement de sites à partir de données extraites depuis les requêtes sur google...

J'incorporerais bien ce proto dans un site officiel mais
il semblerait que cela puisse ne pas respecter les conditions d'utilisation google (http://www.google.com/accounts/TOS?loc=FR
- "5. Utilisation des Services")

Quelles sont les conséquences réelles de ce type de sites vis-à-vis de google?
tant au niveau du référencement que du nombre de requêtes faites...

blacklistage de la page? du domaine? simplement de l'ip pour limitation des requêtes? rien?

Est-ce qu'il y a des expériences?

D'autre part, qui peut-on éventuellement contacter chez google pour avoir une réponse de leur part? voire une autorisation?
Il y a bien le "bureau de vente local france"?...

Le prototype peut être consulté ici : http://www.majolieentreprise.com/googletest/

Pour ceux qui les souhaiteraient...
Les sources (brut de fonderie/non optimisé/compliqué/etc!) sont disponibles à cette adresse :
http://www.majolieentreprise.com/googletest/googletest.zip


Merci d'avance pour vos réponses...
Emmanuel
PS: c'est mon premier post :) alors pardon d'avance pour mes éventuelles bourdes de débutants...


Leonick
WRInaute accro
WRInaute accro
 
Messages: 19598
Inscription: 8 Aoû 2004

Message le Ven Mai 04, 2007 20:08

si tu as une ip fixe, google va te bannir quelques minutes (ou heures ?) et à chaque requête, tu seras obligé de saisir un captcha, sinon, il suffit de réinitialiser ta connexion pour obtenir une autre ip :wink:


Serious
WRInaute passionné
WRInaute passionné
 
Messages: 2438
Inscription: 21 Nov 2005

Message le Ven Mai 04, 2007 21:58

Je pense que le seul risque de blacklistage est celui de l'IP et cela juste pour acceder a Google. Et seulement s'il y a trop de requetes. Legalement, je ne pense pas que Google fera qqch.

Leonick: un captcha chez Google?


Podvin
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 9
Inscription: 13 Avr 2005

Message le Ven Mai 04, 2007 23:39

Merci de vos réponses.

Je n'ai effectivement pas connaissance de captcha sur google...?
Il faut dire que je ne l'ai jamais énervé jusqu'à ce point pour le savoir!

Pour ce qui est de l'IP, elle serait a priori fixe...
L'idée est que ce script soit public... et je préfèrerais que
cela ne soit pas générateur de problèmes de référencement,
plutot le contraire d'ailleurs :wink: ...

Est-ce qu'un blacklistage d'IP s'applique aux différents serveurs google?

Ce que je n'arrive pas trop à sentir, c'est le degré d'acceptation/tolérance
(ou de sanction) de google vis-à-vis des sites qui explorent ses résultats
autrement que par la voie royale...


Leonick
WRInaute accro
WRInaute accro
 
Messages: 19598
Inscription: 8 Aoû 2004

Message le Sam Mai 05, 2007 6:37

Podvin a écrit:Je n'ai effectivement pas connaissance de captcha sur google...?
Il faut dire que je ne l'ai jamais énervé jusqu'à ce point pour le savoir!
Ca arrive très vite : une dizaine de requête sur une cinquantaine d'ip à la suite et hop bloqué. ET là, si on fait une recherche google, il y a le captcha avec un message comme quoi on a peut-être un virus qui fait des requêtes automatiques.

NextGeneration
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 428
Inscription: 27 Sep 2006

Message le Sam Mai 05, 2007 7:56

Ca m'arrive fréquemment avec certains outils d'analyse de positionnement ( free monitor for google ) qui n'utilisent pas l'API, et qui se contentent de taper chez google directement.

Ca fait tout drole la premiere fois :D


Podvin
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 9
Inscription: 13 Avr 2005

Message le Sam Mai 05, 2007 15:13

Une tempo entre deux requêtes peut-elle limiter les risques?


Leonick
WRInaute accro
WRInaute accro
 
Messages: 19598
Inscription: 8 Aoû 2004

Message le Sam Mai 05, 2007 15:16

j'avais essayé une tempo assez courte (1 ou 2 sec) mais ce n'était pas suffisant, même en allant chercher sur d'autres ip, mais de même classe


Podvin
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 9
Inscription: 13 Avr 2005

Message le Lun Mai 07, 2007 12:58

Bon, il faudrait un mécanisme d'interrogations tournant depuis différents serveurs avec différentes ip... ca commence à faire un peu usine à gaz!

Est-ce que c'est la même chose chez Yahoo?
même si cela présente un peu moins d'intérêt, cela peut peut-être être utile d'en extraire des résultats...


Leonick
WRInaute accro
WRInaute accro
 
Messages: 19598
Inscription: 8 Aoû 2004

Message le Lun Mai 07, 2007 13:12

je n'ai pas encore pris de temps pour faire des extractions auto sur d'autres moteurs, mais c'est dans ma todo list 8)


Podvin
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 9
Inscription: 13 Avr 2005

Message le Lun Mai 07, 2007 13:43

A en croire ce message, il semble que cela soit pareil :(
http://www.webrankinfo.com/forums/viewtopic_13814.htm
Sinon pour l'extraction sur yahoo, cela ressemble fort à celle applicable pour google...
Je vais aussi me rajouter cela sur ma todo list :wink:


Si vous avez aimé cette discussion, partagez-la sur vos réseaux sociaux préférés :

Formation recommandée sur ce thème :

Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités