Empecher le crawl d'un lien avec robots.txt
12 messages
• Page 1 sur 1
Consultez la formation sur les stratégies de liens de WebRankInfo / Ranking Metrics
- dumbel
- WRInaute discret

- Messages: 233
- Inscription: 29 Mai 2005
Empecher le crawl d'un lien avec robots.txt
Bonjour,
je souhaiterais ne pas utiliser le rel=nofollow pour l'un des liens externes de mon site.
J'ai donc eu l'idée d'empêcher le crawl de ce lien par l'intermédiaire du "robots.txt" du style:
Disallow: http://www.lelienexterne.tld/page.html
J'ai bon
je souhaiterais ne pas utiliser le rel=nofollow pour l'un des liens externes de mon site.
J'ai donc eu l'idée d'empêcher le crawl de ce lien par l'intermédiaire du "robots.txt" du style:
Disallow: http://www.lelienexterne.tld/page.html
J'ai bon
- Nikola
- WRInaute discret

- Messages: 209
- Inscription: 1 Mar 2006
Re: Empecher le crawl d'un lien avec robots.txt
dumbel a écrit:Bonjour,
je souhaiterais ne pas utiliser le rel=nofollow pour l'un des liens externes de mon site.
J'ai donc eu l'idée d'empêcher le crawl de ce lien par l'intermédiaire du "robots.txt" du style:
Disallow: http://www.lelienexterne.tld/page.html
J'ai bon
Yes !
Exemple :
Dans robot.txt :
User-Agent: *
Disallow: /ton-repertoire/ta-page.html
Il me semble que via google webmaster tools, tu peux signaler ton robot.txt , c'est préférable.
-

GUITEL - WRInaute impliqué

- Messages: 994
- Inscription: 8 Juin 2007
Re: Empecher le crawl d'un lien avec robots.txt
Nikola a écrit:dumbel a écrit:Bonjour,
je souhaiterais ne pas utiliser le rel=nofollow pour l'un des liens externes de mon site.
J'ai donc eu l'idée d'empêcher le crawl de ce lien par l'intermédiaire du "robots.txt" du style:
Disallow: http://www.lelienexterne.tld/page.html
J'ai bon
Yes !![]()
Exemple :
Dans robot.txt :
User-Agent: *
Disallow: /ton-repertoire/ta-page.html
Il me semble que via google webmaster tools, tu peux signaler ton robot.txt , c'est préférable.
Là il bloque toute une page pas un seul lien ?
-

jeanluc - WRInaute accro

- Messages: 3062
- Inscription: 3 Mai 2004
Re: Empecher le crawl d'un lien avec robots.txt
Merci.
Il y a quand même une astuce pour bloquer un lien externe en s'aidant de robots.txt: il faut passer par une redirection.
Puisque tu veux bloquer http://www.lelienexterne.tld/page.html, tu remplaces ce lien dans ton site par http://www.ton_domaine.tld/redirection_1234.html et tu fais en sorte que ce lien fasse une redirection vers la page externe (par .htaccess ou en PHP). Et dans robots.txt, tu mets :
Solution plutôt compliquée...
Jean-Luc
Il y a quand même une astuce pour bloquer un lien externe en s'aidant de robots.txt: il faut passer par une redirection.
Puisque tu veux bloquer http://www.lelienexterne.tld/page.html, tu remplaces ce lien dans ton site par http://www.ton_domaine.tld/redirection_1234.html et tu fais en sorte que ce lien fasse une redirection vers la page externe (par .htaccess ou en PHP). Et dans robots.txt, tu mets :
- Code: Tout sélectionner
User-agent: *
Disallow: /redirection_1234.html
Solution plutôt compliquée...
Jean-Luc
- Rod la Kox
- WRInaute accro

- Messages: 3253
- Inscription: 24 Juin 2008
Re: Empecher le crawl d'un lien avec robots.txt
On ne pas mettre le lien...
C'est encore plus simple.
C'est encore plus simple.
- Nikola
- WRInaute discret

- Messages: 209
- Inscription: 1 Mar 2006
Re: Empecher le crawl d'un lien avec robots.txt
GUITEL a écrit:Nikola a écrit:dumbel a écrit:Bonjour,
je souhaiterais ne pas utiliser le rel=nofollow pour l'un des liens externes de mon site.
J'ai donc eu l'idée d'empêcher le crawl de ce lien par l'intermédiaire du "robots.txt" du style:
Disallow: http://www.lelienexterne.tld/page.html
J'ai bon
Yes !![]()
Exemple :
Dans robot.txt :
User-Agent: *
Disallow: /ton-repertoire/ta-page.html
Il me semble que via google webmaster tools, tu peux signaler ton robot.txt , c'est préférable.
Là il bloque toute une page pas un seul lien ?
Effectivement, j'avais lu la question un peu trop vite...
Et si tu fais un lien en javascript ..
sauf erreur de ma part Google ne le lis pas.
C'est ce qui me parrait le plus simple, propre et logique.
-

nickargall - WRInaute accro

- Messages: 6468
- Inscription: 13 Juin 2005
Re: Empecher le crawl d'un lien avec robots.txt
Question (pour laquelle je pense connaître la réponse mais que je pose quand même): pourquoi ne veux tu pas ajouter un attribut rel="nofollow" sur ces liens ?
-

Leonick - WRInaute accro

- Messages: 19592
- Inscription: 8 Aoû 2004
Re: Empecher le crawl d'un lien avec robots.txt
parce que les moteurs suivent quand même les liens. Il ne lui transmettent juste aucun juice.nickargall a écrit:pourquoi ne veux tu pas ajouter un attribut rel="nofollow" sur ces liens ?
Entre parenthèse, y! ne tient pas compte des restrictions dans le robots.txt, il ne crawle pas la page mais affiche quand même l'url dans ses SERP. Et comme y! tient fortement compte des mots clés dans l'url et à fortiori dans le ndd, on peut se retrouver ainsi avec juste le ndd affiché en 1° page de SERP, alors même qu'on ne le veut pas.
Donc là dessus, gg est à des années lumières de y!, car il respecte la volonté du webmaster de ne pas afficher des liens.
-

Madrileño - Madrileño

- Messages: 28403
- Inscription: 7 Juil 2004
Re: Empecher le crawl d'un lien avec robots.txt
Complément javascript :
http://www.webrankinfo.com/actualites/200605-googlebot-javascript.htm .
http://forum.webrankinfo.com/google-suit-les-liens-javascript-t25677.html .
http://forum.webrankinfo.com/googlebot-interprete-javascript-t38577.html .
http://forum.webrankinfo.com/google-analyse-code-javascript-desormais- ... 44018.html .
http://forum.webrankinfo.com/googlebot-execute-javascript-t62200.html .
http://www.webrankinfo.com/actualites/200605-googlebot-javascript.htm .
http://forum.webrankinfo.com/google-suit-les-liens-javascript-t25677.html .
http://forum.webrankinfo.com/googlebot-interprete-javascript-t38577.html .
http://forum.webrankinfo.com/google-analyse-code-javascript-desormais- ... 44018.html .
http://forum.webrankinfo.com/googlebot-execute-javascript-t62200.html .
12 messages
• Page 1 sur 1
Formation recommandée sur ce thème :
Formation Netlinking (liens et référencement) : apprenez ce qu'est réellement un bon lien pour le référencement et surtout comment en obtenir. Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- [resolu] empecher les robots de suivre un lien externe
- Empecher le crawl d'un sous domaine
- Empecher les robots d'indexer un dossier ?
- Faut-il empêcher les robots de fonctionner ?
- Il ne crawl que le robots.txt
- Empecher les robots de recolte des mails
- [résolu] Empecher les robots d'indexer certaines images
- [Réglé] Empecher les robots de referencer certains fichier
- robots.txt, webmaster tool google, crawl
- Empêcher l'indexation des urls a paramètres sur robots.txt ?
Consultez la description détaillée des produits ou services de Google suivants : Google Sitemaps
- Test de lien (type de redirection)
Cet outil vous permet de tester la validité d'un lien pour le référencement. Il vous indique la nature du lien (lien en dur, redirection bien gérée par les moteurs ou redirection mal gérée par les moteurs). - Calcul du taux de liens vers des pages internes
Cet outil vous permet de calculer le taux de liens profonds vers un site web. Un lien profond est un lien qui ne pointe pas vers la page d'accueil mais au contraire vers une page interne du site. Les sites dont l'essentiel du référencement vient de leurs inscriptions dans des annuaires ont un taux de liens profonds faible ; à l'inverse, les sites de référence ont souvent un taux de liens profonds plus important, signe que leur contenu a suscité de nombreux liens spontanés. - Recherche de citations d'un site en texte brut
Cet outil vous permet de trouver des pages citant votre site mais ne faisant pas (encore) de lien. Il suffira parfois d'un simple mail pour transformer cette simple citation en lien (backlink).
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités
