Messages: 2725

Enregistré le: 14 Aoû 2002

Message le Jeu Juin 01, 2017 13:05

Bonjour

Mon site ( voir profil ), est un site de Turf.

Mon problème : Faire en sorte que mon site ne soit pas facilement copiable.

Pour celà, j'ai mis depuis longtemps les données de statistiques et de pronostics, en mode Javascript.

Mais, à l'époque les moteurs de recherche ne lisaient pas le Javascript.

Suivant en celà, les consignes de Google, j'ai présenté aussi aux bots, le code html d'origine, sans Javascript.

Maintenant, est-ce que c'est du cloaking ?

Google lit-il suffisamment le Javacript, pour que je présente du Javascript même aux bots ?

Ou bien suis-je obligé de faire du tout html ?

Je précise, que pour lire mon Javascript, il faut se lever tôt, le données ne sont pas dans les scripts eux-mêmes, mais chargées à distance en petit Ajax.

Avec des restrictions de timing et de type de lecture ( Ajax ).

Merci beaucoup de vos réponses.

Amicalement.
Haut
7 Réponses
Messages: 8451

Enregistré le: 14 Mai 2003

Message le Jeu Juin 01, 2017 13:37

ortolojf a écrit:Je précise, que pour lire mon Javascript, il faut se lever tôt, le données ne sont pas dans les scripts eux-mêmes, mais chargées à distance en petit Ajax.

Tu peux dire quelle page exactement ?

Parce que ton site il se scrape sans souci:
Code: Tout sélectionner
var page = require('webpage').create();
var 
address 'https://www.pronostics-courses.fr/php/courses_nouvelles/new_courses.php';

page.open(address, function (status) {
    if (
status !== 'success') {
        
console.log('Unable to load the address!');
        
phantom.exit(1);
    } else {
        var 
courses page.evaluate(function () {
            var 
noms document.querySelectorAll('span.nom_course');
            var 
courses = [];
            [].forEach.
call(noms, function (nom) {
                
courses.push(nom.textContent);
            });
            return 
courses;
        });
        
        
courses.forEach(function (element) {
            
console.log(element);
        });
        
        
phantom.exit();
    }
}); 


Image
Haut
Messages: 2725

Enregistré le: 14 Aoû 2002

Message le Jeu Juin 01, 2017 14:14

[quote="spout"]
Tu peux dire quelle page exactement ?

Parce que ton site il se scrape sans souci:
Code: Tout sélectionner
var page = require('webpage').create();
var address = 'https://www.pronostics-courses.fr/php/courses_nouvelles/pronostics_new_courses,4.html';

page.open(address, function (status) {
    if (status !== 'success') {
        console.log('Unable to load the address!');
        phantom.exit(1);
    } else {
        var courses = page.evaluate(function () {
            var noms = document.querySelectorAll('span.nom_course');
            var courses = [];
            [].forEach.call(noms, function (nom) {
                courses.push(nom.textContent);
            });
            return courses;
        });
        
        courses
.forEach(function (element) {
            console.log(element);
        });
        
        phantom
.exit();
    }
});



Bonjour spout ;)

J'ai changé l'url : Il faut que ce soit une url interne de statistiques.

Les stats sont sous <tbody id="statistiques">.

Les pronostics sont sous <tbody id="pronostics">

Merci de tester.

Respectueusement.
Haut
Messages: 8451

Enregistré le: 14 Mai 2003

Message le Jeu Juin 01, 2017 14:25

Scrapable aussi
Image
Haut
Messages: 2725

Enregistré le: 14 Aoû 2002

Message le Jeu Juin 01, 2017 16:55

Bonjour spout

Donc, je peux mettre en javascript pour tout le monde, ou en html ?

Pour convertir mes sites, il me suffira d'agir sur la variable $is_bot

Et aussi : Le autres bots que Google voient aussi les pages javascript ?

Respectueusement.
Haut
Messages: 8451

Enregistré le: 14 Mai 2003

Message le Jeu Juin 01, 2017 18:58

Si tu veux utiliser du JS pour faire un site genre SPA, OK je comprend.
Si c'est pour éviter de se faire scraper, c'est inutile. Autant faire en HTML classique et le JS pour améliorer l'UX.
Haut
Messages: 2725

Enregistré le: 14 Aoû 2002

Message le Jeu Juin 01, 2017 21:03

Bonjour spout

Bon, je vais remettre tout en html.

Mais les copieurs seront nombreux, et je crains fort que mon anti-aspirateur ne soit pas suffisant.

En tout cas, il n'y aura plus aucun cloaking.

Mon référencement devrait s'améliorer.

Merci beaucoup spout ! ;)
Haut
Messages: 2725

Enregistré le: 14 Aoû 2002

Message le Dim Juin 04, 2017 16:49

Bonjour

Là, j'ai un problème.

Depuis que j'ai mis mes stats en pur html, pour certaines pages de statistiques anciennes ( les moins visitées ), Page Speed Insights m'indique plus que 2 secondes de chargement.

Par exemple :

https://www.pronostics-courses.fr/php/courses_anciennes/pronostics_new ... 30101.html

( Il faut faire varier le paramètre, les courses sont depuis 2007 ).

Je sais que je fais un cache MySQL "maison" avec des fichiers ascii temporaires, mais la sortie du Javascript semble avoir empiré les choses.

J'ai mis à jour vers PHP 7.1-5 depuis deux semaines environ, mais celà ne devrait pas influer ?

Merci beaucoup spout. ;)

Respectueusement.
Haut