Empecher le crawl d'un lien avec robots.txt

Consultez la formation sur les stratégies de liens de WebRankInfo / Ranking Metrics

dumbel
WRInaute discret
WRInaute discret
 
Messages: 233
Inscription: 29 Mai 2005

Empecher le crawl d'un lien avec robots.txt

Message le Jeu Avr 02, 2009 20:56

Bonjour,

je souhaiterais ne pas utiliser le rel=nofollow pour l'un des liens externes de mon site.
J'ai donc eu l'idée d'empêcher le crawl de ce lien par l'intermédiaire du "robots.txt" du style:

Disallow: http://www.lelienexterne.tld/page.html

J'ai bon :?:


jeanluc
WRInaute accro
WRInaute accro
 
Messages: 3062
Inscription: 3 Mai 2004

Re: Empecher le crawl d'un lien avec robots.txt

Message le Jeu Avr 02, 2009 20:59

Ben non. :?

On ne peut mettre que des liens internes dans robots.txt.

Jean-Luc

Nikola
WRInaute discret
WRInaute discret
 
Messages: 209
Inscription: 1 Mar 2006

Re: Empecher le crawl d'un lien avec robots.txt

Message le Jeu Avr 02, 2009 21:01

dumbel a écrit:Bonjour,

je souhaiterais ne pas utiliser le rel=nofollow pour l'un des liens externes de mon site.
J'ai donc eu l'idée d'empêcher le crawl de ce lien par l'intermédiaire du "robots.txt" du style:

Disallow: http://www.lelienexterne.tld/page.html

J'ai bon :?:


Yes ! :D

Exemple :
Dans robot.txt :

User-Agent: *
Disallow: /ton-repertoire/ta-page.html

Il me semble que via google webmaster tools, tu peux signaler ton robot.txt , c'est préférable.


jeanluc
WRInaute accro
WRInaute accro
 
Messages: 3062
Inscription: 3 Mai 2004

Re: Empecher le crawl d'un lien avec robots.txt

Message le Jeu Avr 02, 2009 21:12

Hem, hem, hem,... :roll:

Jean-Luc


GUITEL
WRInaute impliqué
WRInaute impliqué
 
Messages: 994
Inscription: 8 Juin 2007

Re: Empecher le crawl d'un lien avec robots.txt

Message le Jeu Avr 02, 2009 21:19

Nikola a écrit:
dumbel a écrit:Bonjour,

je souhaiterais ne pas utiliser le rel=nofollow pour l'un des liens externes de mon site.
J'ai donc eu l'idée d'empêcher le crawl de ce lien par l'intermédiaire du "robots.txt" du style:

Disallow: http://www.lelienexterne.tld/page.html

J'ai bon :?:


Yes ! :D

Exemple :
Dans robot.txt :

User-Agent: *
Disallow: /ton-repertoire/ta-page.html

Il me semble que via google webmaster tools, tu peux signaler ton robot.txt , c'est préférable.



Là il bloque toute une page pas un seul lien ?

dumbel
WRInaute discret
WRInaute discret
 
Messages: 233
Inscription: 29 Mai 2005

Re: Empecher le crawl d'un lien avec robots.txt

Message le Jeu Avr 02, 2009 21:25

Merci Jean Luc ! (et aux autres)

Au fait, j'en profite pour te dire que ton annuaire est excellent et qu'il constitue pour moi une vraie référence ...

:wink:


jeanluc
WRInaute accro
WRInaute accro
 
Messages: 3062
Inscription: 3 Mai 2004

Re: Empecher le crawl d'un lien avec robots.txt

Message le Jeu Avr 02, 2009 21:30

Merci. :wink:

Il y a quand même une astuce pour bloquer un lien externe en s'aidant de robots.txt: il faut passer par une redirection.

Puisque tu veux bloquer http://www.lelienexterne.tld/page.html, tu remplaces ce lien dans ton site par http://www.ton_domaine.tld/redirection_1234.html et tu fais en sorte que ce lien fasse une redirection vers la page externe (par .htaccess ou en PHP). Et dans robots.txt, tu mets :
Code: Tout sélectionner
User-agent: *
Disallow: /redirection_1234.html

Solution plutôt compliquée...

Jean-Luc

Rod la Kox
WRInaute accro
WRInaute accro
 
Messages: 3253
Inscription: 24 Juin 2008

Re: Empecher le crawl d'un lien avec robots.txt

Message le Jeu Avr 02, 2009 22:29

On ne pas mettre le lien...
C'est encore plus simple.

Nikola
WRInaute discret
WRInaute discret
 
Messages: 209
Inscription: 1 Mar 2006

Re: Empecher le crawl d'un lien avec robots.txt

Message le Jeu Avr 02, 2009 23:22

GUITEL a écrit:
Nikola a écrit:
dumbel a écrit:Bonjour,

je souhaiterais ne pas utiliser le rel=nofollow pour l'un des liens externes de mon site.
J'ai donc eu l'idée d'empêcher le crawl de ce lien par l'intermédiaire du "robots.txt" du style:

Disallow: http://www.lelienexterne.tld/page.html

J'ai bon :?:


Yes ! :D

Exemple :
Dans robot.txt :

User-Agent: *
Disallow: /ton-repertoire/ta-page.html

Il me semble que via google webmaster tools, tu peux signaler ton robot.txt , c'est préférable.



Là il bloque toute une page pas un seul lien ?


Effectivement, j'avais lu la question un peu trop vite... :P


Et si tu fais un lien en javascript ..

sauf erreur de ma part Google ne le lis pas.

C'est ce qui me parrait le plus simple, propre et logique.


nickargall
WRInaute accro
WRInaute accro
 
Messages: 6468
Inscription: 13 Juin 2005

Re: Empecher le crawl d'un lien avec robots.txt

Message le Ven Avr 03, 2009 8:57

Question (pour laquelle je pense connaître la réponse mais que je pose quand même): pourquoi ne veux tu pas ajouter un attribut rel="nofollow" sur ces liens ?


Leonick
WRInaute accro
WRInaute accro
 
Messages: 19592
Inscription: 8 Aoû 2004

Re: Empecher le crawl d'un lien avec robots.txt

Message le Ven Avr 03, 2009 17:19

nickargall a écrit:pourquoi ne veux tu pas ajouter un attribut rel="nofollow" sur ces liens ?
parce que les moteurs suivent quand même les liens. Il ne lui transmettent juste aucun juice.
Entre parenthèse, y! ne tient pas compte des restrictions dans le robots.txt, il ne crawle pas la page mais affiche quand même l'url dans ses SERP. Et comme y! tient fortement compte des mots clés dans l'url et à fortiori dans le ndd, on peut se retrouver ainsi avec juste le ndd affiché en 1° page de SERP, alors même qu'on ne le veut pas.
Donc là dessus, gg est à des années lumières de y!, car il respecte la volonté du webmaster de ne pas afficher des liens. :evil:



Si vous avez aimé cette discussion, partagez-la sur vos réseaux sociaux préférés :

Formation recommandée sur ce thème :

Formation Netlinking (liens et référencement) : apprenez ce qu'est réellement un bon lien pour le référencement et surtout comment en obtenir. Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :

Consultez la description détaillée des produits ou services de Google suivants : Google Sitemaps

  • Test de lien (type de redirection)
    Cet outil vous permet de tester la validité d'un lien pour le référencement. Il vous indique la nature du lien (lien en dur, redirection bien gérée par les moteurs ou redirection mal gérée par les moteurs).
  • Calcul du taux de liens vers des pages internes
    Cet outil vous permet de calculer le taux de liens profonds vers un site web. Un lien profond est un lien qui ne pointe pas vers la page d'accueil mais au contraire vers une page interne du site. Les sites dont l'essentiel du référencement vient de leurs inscriptions dans des annuaires ont un taux de liens profonds faible ; à l'inverse, les sites de référence ont souvent un taux de liens profonds plus important, signe que leur contenu a suscité de nombreux liens spontanés.
  • Recherche de citations d'un site en texte brut
    Cet outil vous permet de trouver des pages citant votre site mais ne faisant pas (encore) de lien. Il suffira parfois d'un simple mail pour transformer cette simple citation en lien (backlink).


Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités