Pages "protégées" : donner accès à Googlebot

Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics

sdamain
WRInaute accro
WRInaute accro
 
Messages: 1268
Inscription: Mar Oct 14, 2003 7:36

Pages "protégées" : donner accès à Googlebot

Message le Jeu Mar 20, 2008 16:01

Bonjour à tous,

Google indique ceci dans son aide : http://www.google.fr/support/news_pub/b ... opic=11707

En gros, ils expliquent qu'il est tout à fait possible et toléré de donner accès à Googlebot sur des pages protégées (des pages que le visiteur ne peut par exemple accéder que lorsqu'il est enregistré sur le site).

La technique est de tester la valeur du user-agent.
Si user-agent = Googlebot, on donne l'accès à la page.

Cette explication est donnée dans le cadre de Google News.

A votre avis, est-ce également autorisé au niveau indexation dans le moteur de recherche Google?


dorian53
WRInaute accro
WRInaute accro
 
Messages: 1898
Inscription: Dim Avr 10, 2005 16:56

Message le Jeu Mar 20, 2008 16:42

Salut,

Si le simple fait d'avoir un "user-agent = Googlebot" donne accès à tes pages, je ne considère pas qu'elles sont protégées.

Après, le débat a déjà été lancé, pour ma part c'est de la triche parce que lorsque que je vais cliquer sur un résultat dans les SERP, je n'arriverai pas sur la pages et les informations désirées.

FloBaoti
WRInaute passionné
WRInaute passionné
 
Messages: 682
Inscription: Dim Avr 30, 2006 18:42

Message le Jeu Mar 20, 2008 16:52

Il ne faut bien évidemment pas se baser QUE sur le user-agent, qui est facilement modifiable.
Il faut regarder le reverse DNS de l'IP, et l'IP du reverse DNS obtenu. Si les 2 IP correspondent et que le reverse fini par google.com, c'est bien un Bot Google.


manthoR
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 225
Inscription: Lun Mar 13, 2006 23:12

Message le Jeu Mar 20, 2008 17:02

dorian53 a écrit:Salut,

Si le simple fait d'avoir un "user-agent = Googlebot" donne accès à tes pages, je ne considère pas qu'elles sont protégées.

Après, le débat a déjà été lancé, pour ma part c'est de la triche parce que lorsque que je vais cliquer sur un résultat dans les SERP, je n'arriverai pas sur la pages et les informations désirées.


Et surtout, il te suffit alors de retourner sur la recherche et de faire "voir page en cache" :) truc et astuce pour pas mal de site... (experts-exchange? :))

sdamain
WRInaute accro
WRInaute accro
 
Messages: 1268
Inscription: Mar Oct 14, 2003 7:36

Message le Jeu Mar 20, 2008 17:23

dorian53 a écrit:Salut,
Après, le débat a déjà été lancé, pour ma part c'est de la triche parce que lorsque que je vais cliquer sur un résultat dans les SERP, je n'arriverai pas sur la pages et les informations désirées.


Je me suis mal expliqué.
Il n'est pas question de tricher.

Je prends un exemple pour mieux me faire comprendre :
Prenons l'exemple d'un site d'actualité.
Je vais sur le site et je fais une recherche parmi les articles.
Je tombe sur une liste de résultats. Je décide de cliquer sur l'un de ces résultats afin de lire l'article complet et là je reçois un message / popup qui m'indique que je dois m'inscrire pour consulter cet article.

Maintenant, je souhaite que ces articles "protégés" soient tout de même indexés par Google.
Donc lorsque dans une recherche Google on tombe sur un de ces articles, on y a bien accès. Et la page présentée et identique à celle présentée au visiteur qui est inscris sur le site.
Mais on a accès qu'à cet article là, pas à tous les autres, à moins de s'inscrire sur le site.

FloBaoti
WRInaute passionné
WRInaute passionné
 
Messages: 682
Inscription: Dim Avr 30, 2006 18:42

Message le Jeu Mar 20, 2008 17:27

Ben le visiteur qui vient de Google n'est pas forcément inscrit, donc il ne voit pas la page qu'il souhaitait voir mais un message l'invitant à s'inscrire....

sdamain
WRInaute accro
WRInaute accro
 
Messages: 1268
Inscription: Mar Oct 14, 2003 7:36

Message le Jeu Mar 20, 2008 17:30

Non car la restriction d'accès n'est pas mise en place dans le code de la page article elle-même mais plutôt au niveau du lien vers l'article dans la page de résultats interne du site.

FloBaoti
WRInaute passionné
WRInaute passionné
 
Messages: 682
Inscription: Dim Avr 30, 2006 18:42

Message le Jeu Mar 20, 2008 17:32

Ok donc c'est de la restriction bidon, facilement contournable...

Reste plus qu'elle soit en Javascript, et Google passe déjà dessus sans la voir :lol:

sdamain
WRInaute accro
WRInaute accro
 
Messages: 1268
Inscription: Mar Oct 14, 2003 7:36

Message le Jeu Mar 20, 2008 18:09

Pas en javascript, et pas si bidon que cela :wink:

Pourrions nous en revenir à ma question initiale : est-ce que google tolère cette pratique uniquement pour Google Actu ou est-ce également le cas pour l'indexation dans son moteur?


dorian53
WRInaute accro
WRInaute accro
 
Messages: 1898
Inscription: Dim Avr 10, 2005 16:56

Message le Ven Mar 21, 2008 9:46

sdamain a écrit:
dorian53 a écrit:Salut,
Après, le débat a déjà été lancé, pour ma part c'est de la triche parce que lorsque que je vais cliquer sur un résultat dans les SERP, je n'arriverai pas sur la pages et les informations désirées.


Je me suis mal expliqué.
Il n'est pas question de tricher.

Je prends un exemple pour mieux me faire comprendre :
Prenons l'exemple d'un site d'actualité.
Je vais sur le site et je fais une recherche parmi les articles.
Je tombe sur une liste de résultats. Je décide de cliquer sur l'un de ces résultats afin de lire l'article complet et là je reçois un message / popup qui m'indique que je dois m'inscrire pour consulter cet article.


Sisi j'avais bien compris :) et d'ailleurs...

FloBaoti a écrit:Ben le visiteur qui vient de Google n'est pas forcément inscrit, donc il ne voit pas la page qu'il souhaitait voir mais un message l'invitant à s'inscrire....


Je confirme ce point de vue qui est exactement le même que moi.

sdamain
WRInaute accro
WRInaute accro
 
Messages: 1268
Inscription: Mar Oct 14, 2003 7:36

Message le Ven Mar 21, 2008 11:04

Tu n'as toujours pas compris ... laisse tomber.


ybet
WRInaute accro
WRInaute accro
 
Messages: 6755
Inscription: Sam Nov 22, 2003 8:37

Message le Ven Mar 21, 2008 11:35

Bonjour Seb, ca faisait longtemps qu'on t'avait pas vu sur ce forum. :wink:

Créer un compte pour Google et pas pour les utilisateurs me semble assez risqué, simplement parceque le cache et le contenu sera différent pour le visiteur (en plus que le cache sera visible par l'utilisateur). Ca risque très vite d'attérir dans un spams report.

Dans l'article de Google, il ne parle pas exactement du User-Agent mais polutôt de l'adresse IP dans la plage 66.249.64.0 - 20 (une petit nuance). Ca me semble putôt réservé aux actualités, pas au robots d'indexation. Déjà plusieurs ne sont pas repris dans la plage d'adresse indiquée par l'article. Je pense que la plage d'adresse est spécifique pour les robots de news.

Je jouerais pas trop à celà, du moins c'est mon avis.

sdamain
WRInaute accro
WRInaute accro
 
Messages: 1268
Inscription: Mar Oct 14, 2003 7:36

Message le Ven Mar 21, 2008 12:03

Je viens très régulièrement mais je ne poste plus beaucoup.

Il n'y aurait pas de différence entre le cache et le contenu, car ce serait identiquement les mêmes pages avec identiquement le même contenu.
Simplement, le visiteur ne pourrait pas arriver jusqu'à l'article sans s'inscrire tandis que Google y aurait accès.

Merci pour ton opinion sur la tolérance de Google par rapport à ce sujet, enfin un membre qui répond à ma question initiale :wink:


e-kiwi
Modérateur
Modérateur
 
Messages: 13818
Inscription: Mar Déc 23, 2003 9:04

Message le Ven Mar 21, 2008 13:43

meta name=noarchive :D


Formation recommandée sur ce thème :

Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :

Consultez la description détaillée des produits ou services de Google suivants : Googlebot

  • Suggestion de mots
    Cet outil vous fournit une liste de mots sémantiquement proches du mot que vous fournissez en entrée. Il peut servir à vous donner des idées de mots à utiliser sur vos pages, voire de contenus à ajouter.
  • Détection de pages dupliquées
    Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages). Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation... Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués.


Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 1 invité