Messages: 2767

Enregistré le: 14 Aoû 2002

Message le Dim Nov 10, 2013 16:01

Bonjour

Mon problème est, d'empêcher l'aspiration de mes données de courses par d 'autres sites.

Pour celà, j'ai mis ces données de courses, accessibles uniquement en mode petit Ajax ( = Javascript ).

Mais... Sans traitement particulier, Google ne verrait pas ces données, donc ne les indexerait pas.

Donc, je détecte que le visiteur est un bot de moteur d recherche ( d'une manière efficace, pas par l'user agent ), et si c'est le cas, je lui présente les données en clair dans le code html.

Mais... cette présentation, c'est précisément la même que celle que voit l'internaute lambda.

Le contenu apparent est le même dans les deux cas.

Est-ce du cloaking ?

Merci beaucoup de vos réponses.

Amicalement.

Jean François Ortolo
Haut
11 Réponses
Messages: 13572

Enregistré le: 5 Déc 2004

Message le Dim Nov 10, 2013 20:11

ortolojf a écrit:Mais... cette présentation, c'est précisément la même que celle que voit l'internaute lambda.
Le contenu apparent est le même dans les deux cas.
Est-ce du cloaking ?

Non, le cloaking c'est un contenu informatif différent pour l'humain et le bot.
Haut
Messages: 2767

Enregistré le: 14 Aoû 2002

Message le Dim Nov 10, 2013 20:38

zeb a écrit:
ortolojf a écrit:Mais... cette présentation, c'est précisément la même que celle que voit l'internaute lambda.
Le contenu apparent est le même dans les deux cas.
Est-ce du cloaking ?

Non, le cloaking c'est un contenu informatif différent pour l'humain et le bot.



Bonsoir zeb ;)

Merci de me le confirmer.

En effet, dans le cas d'un internaute lambda ( = pas un bot ), le contenu html contient le code Javascript ( = Ajax ), mais pas les données.

Les données dans ce cas, sont chargées par le déclenchement en Ajax d'un script php du site, qui fournit les données que le code Javascript interprète.

Cependant, après interprétation Javascript, le contenu apparent est rigoureusement le même, que le code html autrement directement rendu si c'est un bot.

Cà marche ?

Je dois dire, que depuis deux semaines environ, dans la catégorie Alexa "France/Courses", mon site est passé du rang 26 au rang 14. ;)

J'espère seulement que Google ne va pas me backlister un de ces jours... ;(

Merci beaucoup de ta réponse.

Respectueusement.

Jean François Ortolo
Haut
Messages: 12290

Enregistré le: 23 Nov 2005

Message le Lun Nov 11, 2013 0:49

Sauf que le classement Alexa n'a aucune espèce d'importance. La pertinence de ce classement n'est déjà pas bien au top aux US, alors chez nous... le trafic a-t-il baissé ?

Pour le reste, si tant est que le résultat affiché est le même, j'aurai tendance à dire que tu te prends la tête pour rien.
Haut
Messages: 13572

Enregistré le: 5 Déc 2004

Message le Lun Nov 11, 2013 9:54

Si vraiment tu veux éviter qu'on te pompe tes données pourquoi ne les présente tu pas sous forme d'image avec une ull aléatoire ? elle ne son dispo que pour une consultation donnée et son difficilement copiable autrement qu'a la main ce qui sera de toute façon toujours le cas.

il faudrait que tu nous donne une url d'exemple car depuis le temps que tu te prend la tête j'avoue ne pas comprendre ce que tu cherche a faire (du moins ce que tu cherche a protéger)
Haut
Messages: 2767

Enregistré le: 14 Aoû 2002

Message le Lun Nov 11, 2013 10:20

zeb a écrit:Si vraiment tu veux éviter qu'on te pompe tes données pourquoi ne les présente tu pas sous forme d'image avec une ull aléatoire ? elle ne son dispo que pour une consultation donnée et son difficilement copiable autrement qu'a la main ce qui sera de toute façon toujours le cas.

il faudrait que tu nous donne une url d'exemple car depuis le temps que tu te prend la tête j'avoue ne pas comprendre ce que tu cherche a faire (du moins ce que tu cherche a protéger)



Bonjour zeb ;)

Voici des urls pour respectivement :

- Course ancienne, Réunion 1 Course 1 du 9 Novembre 2013 :

www.pronostics-courses.fr/php/courses_anciennes/pronostics_old_courses ... 03701.html

- Réunion 2 Course 7 de cette après-midi ( visible aujourd'hui avant 14h30 ) :

www.pronostics-courses.fr/php/courses_nouvelles/pronostics_new_courses,15.html

- Réunion 7 Course 5 d'hier ( visible aujourd'hui avant 14h30 ) :

www.pronostics-courses.fr/php/courses_actuelles/pronostics_new_courses,33.html


En ce qui concerne la solution "image", je pense simplement que pour copier mon site automatiquement maintenant, il faudrait des compétences qui dépassent celles d'un webmaster Turfiste ( mes concurrents ), ces webmasters étant en général, peu ferrés sur les problèmes informatique.

Si vous arrivez à copier mes données automatiquement, merci de me le dire ? ;)

Merci beaucoup à zeb pour ta réponse.

Très amicalement.

Jean François Ortolo
Haut
Messages: 13572

Enregistré le: 5 Déc 2004

Message le Lun Nov 11, 2013 10:24

Je n'ai pas le temps de regarder ce matin (je dois partir) mais je regarderais en soirée, juste un constat rapide tu gagnerait a minifier ton javascript (histoire de le rendre illisible quitte a protéger autant ...), mais aussi l'exporter dans une fichier distinct peut être.
Haut
Messages: 2767

Enregistré le: 14 Aoû 2002

Message le Lun Nov 11, 2013 10:34

zeb a écrit:Je n'ai pas le temps de regarder ce matin (je dois partir) mais je regarderais en soirée, juste un constat rapide tu gagnerait a minifier ton javascript (histoire de le rendre illisible quitte a protéger autant ...), mais aussi l'exporter dans une fichier distinct peut être.



Bonjour zeb

Je ne sais pas comment minifier un script Javascript.

Je vais me renseigner sur Internet.

Merci beaucoup beaucoup pour ton conseil.

Respectueusement.

Jean François Ortolo
Haut
Messages: 705

Enregistré le: 26 Avr 2011

Message le Lun Nov 11, 2013 11:46

Pour info ton contenu se scrappe en moins de 10min pour quelqu'un qui s'y connait un peu. Et je parle avec curl, pas avec des tools évolués.

Et pour ta 1ére question il suffit de consulter la doc google : https://support.google.com/webmasters/answer/66355 & https://support.google.com/webmasters/answer/66353

Et vu le 2nd lien, c'est du cloaking ce que tu fais. Après ta quasiment aucune chance de te faire chopper sauf à en parler publiquement...
Haut
Messages: 2767

Enregistré le: 14 Aoû 2002

Message le Lun Nov 11, 2013 11:58

_Soul a écrit:Pour info ton contenu se scrappe en moins de 10min pour quelqu'un qui s'y connait un peu. Et je parle avec curl, pas avec des tools évolués.



Bonjour Soul ;)

Dans la théorie...

Et dans la pratique ?

Bien amicalement.

Jean François Ortolo
Haut
Messages: 2767

Enregistré le: 14 Aoû 2002

Message le Lun Nov 11, 2013 12:05

zeb a écrit:Je n'ai pas le temps de regarder ce matin (je dois partir) mais je regarderais en soirée, juste un constat rapide tu gagnerait a minifier ton javascript (histoire de le rendre illisible quitte a protéger autant ...), mais aussi l'exporter dans une fichier distinct peut être.



Rebonjour seb

Je crois, que le fait de minifier un script Javascript, consiste à en éliminer les caractères surperflus, puis à le passer à la moulinette gzip.

Mais... Tous mon code html est déjà compressé ( mode deflate ou gzip ), ce qui fait que si on le charge ( même avec curl ), son contenu est déjà décompressé à la réception.

Donc, comment minifier le code Javascript, contenu dans mon code html ?

Ou bien, comment gérer cette minification, soit dans un script Javascript séparé, soit intégré dans le code html ?

Merci beaucoup de ta réponse.

Amicalement.

Jean François Ortolo
Haut
Messages: 2767

Enregistré le: 14 Aoû 2002

Message le Mar Nov 12, 2013 15:12

Bonjour

J'ai trouvé le logiciel : JsMin, qui peut convenir.

Je l'ai adapté pour mon ordinateur.

Il nécessite PHP >= 5.3.10 , et mon serveur OVH VPS sous Debian Squeeze a seulement : PHP 5.3.3-17. ;(

Je me prépare à faire un 'apt-get dist-upgrade' sur ce serveur ( ce soir probablement, après avoir vérifié sur le net toutes les manipulations à faire sur MySQL, configurations, etc... ).

J'espère simplement que le serveur ne va pas crasher... ;)

Bien amicalement.

Jean François Ortolo
Haut