Décortiquer le cloaking

Nouveau WRInaute
bonsoir,

je cherche un logiciel qui me permette de comparer deux pages pour trouver le cloaking.
google me précise qu'il y a 353 caractères de plus dans la pages bot.

sur 48 pages, j'aurais besoin d'un petit coup de main :roll:

merci a vous tous pour ce forum
 
Nouveau WRInaute
je souhaite trouver le difference entre la page destinnée au robot et celle destinnée à l'utilisateur.

ps: je n'ai même pas de site, donc, pas d'équivoque :wink:
 
Nouveau WRInaute
désolé rod la kox, pas vu ton post

j'ai les deux codes sources. je veux les comparer. il y a 553 signes de différence.

merci de votre promptitude, ce forum est bien vivant
 
Nouveau WRInaute
:evil: :evil: :evil: :evil: :evil: :evil:


mouais mouais mouais

et sinon, tu me pretes ton cerveau avec :lol:

j'ai pas compris grand chose a ton lien, mais je ne programme-helas-absolument pas.

peut être serait tu intéressé(e) par les fichiers?
sachant que les 4 sites testés sont en pr5 sur la même requete, et qu'ils ont tous les 4 du cloaking. et pas uniquement sur les pages d'accueil.
de plus, je m'interroge. parfois les pages pour le bot sont plus lourdes que celles du naviguateur, parfois l'inverse. j'aimerais comprendre ce truc, et voir si cela entrainera un déclassement dans les mois a venir.

merci à toi:)
 
WRInaute occasionnel
Bah tu as juste à uploader le tout sur ton serveur et lancer la page Example.php mais, ça ne doit pas donner un résultat aussi précis que tu le souhaites...

Edit : Sinon il doit y avoir moyen de faire quelque chose avec la fonction php similar_text mais tu ne pourra comparer que 2 fichiers à la fois et tu n'aura que le nombre de caractères de différence pour chaque ligne, donc faudra quand même scruter le code.
 
Nouveau WRInaute
hhihihi

Mais je n'ai pas de serveur.. ou alors je ne sais pas de quoi tu parles.
Sincèrement désolé de te faire perdre ton temps. Et merci de ton attention.

Tant pis, il y a d'autres mystères sur terre.
 
WRInaute occasionnel
:D bon bah fait tourner tes fichiers. Euh peut être pas les 48 quand même mais disons 4 que j'essaye de te faire un truc que tu pourra réutiliser pour les 44 autres :wink:
 
WRInaute occasionnel
Ces pages ne sont pas du tout cloakées...
La différence de caractères est juste dûe à la présence des variables de sessions dans les liens internes. Elles y sont dans la page utilisateur et pas dans celle googlebot donc plutôt une manip dans le .htaccess.
 
Nouveau WRInaute
ah merci, cela me rassure.

désolé pour la perte de temps, mais je n'ai fait qu'utiliser l'outil google... sans les compétences pour exploiter les résultats.

je cesse de t'embêter, et vais sur le forum pour comprendre le sens de ta réponse^^

merci

ps: serviable et compétente, tu devrais vite me ban^^ :twisted:
 
Nouveau WRInaute
tu es décidément bien patient!

donc,

variables de sessions: ?


liens internes: ?

pour la suite, je vais d'abord me renseigner sur le fonctionnement du htacces.

pour les deux termes au dessus, pas de dico dans WRI ( ou pas trouvé).

merci à toi
 
WRInaute accro
hazy a dit:
ps: je n'ai même pas de site, donc, pas d'équivoque :wink:
...
j'ai pas compris grand chose a ton lien, mais je ne programme-helas-absolument pas.
...
Mais je n'ai pas de serveur.. ou alors je ne sais pas de quoi tu parles.
en clair, tu as lu un article qui parlait de cloaking et qui disait qu'il n'y avait que comme cela que l'on pouvait bien se positionner et tu veux comprendre :lol:
Condition minimum nécessaire d'un site cloaké : pas de possibilité d'afficher la page en cache sur google, voire même pas le snippet, ou alors c'est un grey hat qui s'en est occupé (entre white hat et black hat :lol: ), là ce n'est pas le cas.
Attention, tous les sites qui ne veulent pas afficher le cache ne sont pas des sites de cloaking, on a d'autres motifs de ne pas afficher le cache (du genre site d'actualité dont la page d'accueil change souvent)
 
Nouveau WRInaute
Bonour :)

En fait, j'ai lu ( ici ) un article disant que google pénalisait l'usage du cloaking.

J'etais donc surpris de voir sur 4 site en pr5 que l'outil de détection de cloaking fourni par google les signalait comme cloakés.

je ne savais pas que la différence pouvait être due à d'autre choses.

J'ai donc compris une chose: je suis incapable de voir si un site est "honnête" ou non.

:?

être nul est une chance, cela rends le progrès facile^^

merci de ton attention
 
WRInaute occasionnel
Leonick a dit:
hazy a dit:
l'outil de détection de cloaking fourni par google
quel outil ?

Celui-là En revanche je doute qu'il soit fourni par Google...
Et puis c'est vraiment pas la panassée pour détecter le cloaking dans la mesure ou il présente juste les pages en fonction des User-Agent et comme dit plus haut si le cloaking est basé sur IP c'est inutile...

Pour voir si un site est honnête, comme l'a dit Leonick regardes déjà si le lien "en cache" est présent dans les résultats Google pour la page donnée. Si il n'y est pas alors ya 95% (voire +) pour que cette page soit cloakée...

Les variables de sessions c'est les trucs qui se baladent dans les URL, exemple : url.php?sessid=12345678987654321123456789.
Et si tu gère un site il vaut mieux les désactiver par le .htaccess car risque de duplicate content (pleins de sujets la dessus ds le forum).

Les liens internes ce sont les liens internes à ton site, qui permettent de naviguer dedans, par exemple le lien en home qui mène vers la page produit.
 
Discussions similaires
Haut