Pages "protégées" : donner accès à Googlebot
14 messages • Page 1 sur 1
Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics
Pages "protégées" : donner accès à Googlebot
Bonjour à tous,
Google indique ceci dans son aide : http://www.google.fr/support/news_pub/b ... opic=11707
En gros, ils expliquent qu'il est tout à fait possible et toléré de donner accès à Googlebot sur des pages protégées (des pages que le visiteur ne peut par exemple accéder que lorsqu'il est enregistré sur le site).
La technique est de tester la valeur du user-agent.
Si user-agent = Googlebot, on donne l'accès à la page.
Cette explication est donnée dans le cadre de Google News.
A votre avis, est-ce également autorisé au niveau indexation dans le moteur de recherche Google?
Google indique ceci dans son aide : http://www.google.fr/support/news_pub/b ... opic=11707
En gros, ils expliquent qu'il est tout à fait possible et toléré de donner accès à Googlebot sur des pages protégées (des pages que le visiteur ne peut par exemple accéder que lorsqu'il est enregistré sur le site).
La technique est de tester la valeur du user-agent.
Si user-agent = Googlebot, on donne l'accès à la page.
Cette explication est donnée dans le cadre de Google News.
A votre avis, est-ce également autorisé au niveau indexation dans le moteur de recherche Google?
Salut,
Si le simple fait d'avoir un "user-agent = Googlebot" donne accès à tes pages, je ne considère pas qu'elles sont protégées.
Après, le débat a déjà été lancé, pour ma part c'est de la triche parce que lorsque que je vais cliquer sur un résultat dans les SERP, je n'arriverai pas sur la pages et les informations désirées.
Si le simple fait d'avoir un "user-agent = Googlebot" donne accès à tes pages, je ne considère pas qu'elles sont protégées.
Après, le débat a déjà été lancé, pour ma part c'est de la triche parce que lorsque que je vais cliquer sur un résultat dans les SERP, je n'arriverai pas sur la pages et les informations désirées.
Il ne faut bien évidemment pas se baser QUE sur le user-agent, qui est facilement modifiable.
Il faut regarder le reverse DNS de l'IP, et l'IP du reverse DNS obtenu. Si les 2 IP correspondent et que le reverse fini par google.com, c'est bien un Bot Google.
Il faut regarder le reverse DNS de l'IP, et l'IP du reverse DNS obtenu. Si les 2 IP correspondent et que le reverse fini par google.com, c'est bien un Bot Google.
dorian53 a écrit:Salut,
Si le simple fait d'avoir un "user-agent = Googlebot" donne accès à tes pages, je ne considère pas qu'elles sont protégées.
Après, le débat a déjà été lancé, pour ma part c'est de la triche parce que lorsque que je vais cliquer sur un résultat dans les SERP, je n'arriverai pas sur la pages et les informations désirées.
Et surtout, il te suffit alors de retourner sur la recherche et de faire "voir page en cache"
dorian53 a écrit:Salut,
Après, le débat a déjà été lancé, pour ma part c'est de la triche parce que lorsque que je vais cliquer sur un résultat dans les SERP, je n'arriverai pas sur la pages et les informations désirées.
Je me suis mal expliqué.
Il n'est pas question de tricher.
Je prends un exemple pour mieux me faire comprendre :
Prenons l'exemple d'un site d'actualité.
Je vais sur le site et je fais une recherche parmi les articles.
Je tombe sur une liste de résultats. Je décide de cliquer sur l'un de ces résultats afin de lire l'article complet et là je reçois un message / popup qui m'indique que je dois m'inscrire pour consulter cet article.
Maintenant, je souhaite que ces articles "protégés" soient tout de même indexés par Google.
Donc lorsque dans une recherche Google on tombe sur un de ces articles, on y a bien accès. Et la page présentée et identique à celle présentée au visiteur qui est inscris sur le site.
Mais on a accès qu'à cet article là, pas à tous les autres, à moins de s'inscrire sur le site.
Pas en javascript, et pas si bidon que cela
Pourrions nous en revenir à ma question initiale : est-ce que google tolère cette pratique uniquement pour Google Actu ou est-ce également le cas pour l'indexation dans son moteur?
Pourrions nous en revenir à ma question initiale : est-ce que google tolère cette pratique uniquement pour Google Actu ou est-ce également le cas pour l'indexation dans son moteur?
sdamain a écrit:dorian53 a écrit:Salut,
Après, le débat a déjà été lancé, pour ma part c'est de la triche parce que lorsque que je vais cliquer sur un résultat dans les SERP, je n'arriverai pas sur la pages et les informations désirées.
Je me suis mal expliqué.
Il n'est pas question de tricher.
Je prends un exemple pour mieux me faire comprendre :
Prenons l'exemple d'un site d'actualité.
Je vais sur le site et je fais une recherche parmi les articles.
Je tombe sur une liste de résultats. Je décide de cliquer sur l'un de ces résultats afin de lire l'article complet et là je reçois un message / popup qui m'indique que je dois m'inscrire pour consulter cet article.
Sisi j'avais bien compris
FloBaoti a écrit:Ben le visiteur qui vient de Google n'est pas forcément inscrit, donc il ne voit pas la page qu'il souhaitait voir mais un message l'invitant à s'inscrire....
Je confirme ce point de vue qui est exactement le même que moi.
Bonjour Seb, ca faisait longtemps qu'on t'avait pas vu sur ce forum.
Créer un compte pour Google et pas pour les utilisateurs me semble assez risqué, simplement parceque le cache et le contenu sera différent pour le visiteur (en plus que le cache sera visible par l'utilisateur). Ca risque très vite d'attérir dans un spams report.
Dans l'article de Google, il ne parle pas exactement du User-Agent mais polutôt de l'adresse IP dans la plage 66.249.64.0 - 20 (une petit nuance). Ca me semble putôt réservé aux actualités, pas au robots d'indexation. Déjà plusieurs ne sont pas repris dans la plage d'adresse indiquée par l'article. Je pense que la plage d'adresse est spécifique pour les robots de news.
Je jouerais pas trop à celà, du moins c'est mon avis.
Créer un compte pour Google et pas pour les utilisateurs me semble assez risqué, simplement parceque le cache et le contenu sera différent pour le visiteur (en plus que le cache sera visible par l'utilisateur). Ca risque très vite d'attérir dans un spams report.
Dans l'article de Google, il ne parle pas exactement du User-Agent mais polutôt de l'adresse IP dans la plage 66.249.64.0 - 20 (une petit nuance). Ca me semble putôt réservé aux actualités, pas au robots d'indexation. Déjà plusieurs ne sont pas repris dans la plage d'adresse indiquée par l'article. Je pense que la plage d'adresse est spécifique pour les robots de news.
Je jouerais pas trop à celà, du moins c'est mon avis.
Je viens très régulièrement mais je ne poste plus beaucoup.
Il n'y aurait pas de différence entre le cache et le contenu, car ce serait identiquement les mêmes pages avec identiquement le même contenu.
Simplement, le visiteur ne pourrait pas arriver jusqu'à l'article sans s'inscrire tandis que Google y aurait accès.
Merci pour ton opinion sur la tolérance de Google par rapport à ce sujet, enfin un membre qui répond à ma question initiale
Il n'y aurait pas de différence entre le cache et le contenu, car ce serait identiquement les mêmes pages avec identiquement le même contenu.
Simplement, le visiteur ne pourrait pas arriver jusqu'à l'article sans s'inscrire tandis que Google y aurait accès.
Merci pour ton opinion sur la tolérance de Google par rapport à ce sujet, enfin un membre qui répond à ma question initiale
14 messages • Page 1 sur 1
Formation recommandée sur ce thème :
Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- La danse de Googlebot :-) La Google Dance
- Etude de Googlebot, le robot d'indexation de Google
- Googlebot analyse certains codes JavaScript
- Mise à jour de Google Images (Juillet 2006)
- Etude de Googlebot, le robot crawler de Google (Fresh Bot, Deep Bot)
- Google accélère le rythme des mises à jour
- Le Full Crawl a enfin commencé
- Le code source du projet de recherche géographique est disponible
- Configurer les options de passage de Googlebot sur son site
- Les adresses IP de Google et Googlebot
- Differences entre "web" "pages franco" e
- Résultats pages "Web" et pages "France"
- "Desc" et "Keyword" : toutes pages?
- Googl : différence entre "web" "pages franco.
- Option "Pages : France" et ".fr"
- Googlebot "voit-il" le contenu des div en dispaly
- Googlebot "bloqué" sur mon site ?
- comment "forcer" googlebot a revenir en urgence
- Detection googlebot et "skin switching"
- "Ce que voit Googlebot" : du porno
Consultez la description détaillée des produits ou services de Google suivants : Googlebot
- Suggestion de mots
Cet outil vous fournit une liste de mots sémantiquement proches du mot que vous fournissez en entrée. Il peut servir à vous donner des idées de mots à utiliser sur vos pages, voire de contenus à ajouter. - Détection de pages dupliquées
Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages). Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation... Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 1 invité







le forum