Méta-tag "robots"
7 messages • Page 1 sur 1
Consultez la formation à Google Analytics de WebRankInfo / Ranking Metrics
- curieuxmann
- WRInaute discret

- Messages: 94
- Inscription: Dim Nov 23, 2003 17:34
Méta-tag "robots"
Bonsoir,
En espèrant que la question n'a pas déjà été posée (La fonction recherche ne m'a pas permise de trouver de réponses précises à ma question).
J'aimerais savoir si l'utilisation de la syntaxe ci-dessous relative à la Meta-Tag "robots" (à placer entre les balises <head> et </head>) permettant d'indiquer aux robots des moteurs de recherche l'indextation ou non d'une page et/ou des liens hypertextes est-elle efficace dans tous les moteurs de recherches (Google, Altavista, Yahoo, etc.)
La syntaxe ci-dessus permet par exemple d'indiquer aux robots :
- La page ne sera pas indexée par le robot grace à la valeur "noindex" ;
- Les liens contenus dans la page ne seront pas indexés grace à la valeur "nofollow".
D'ailleurs dans mon exemple, je crois qu'il est aussi possible d'écrire :
non ?
D'avance merci pour vos réponses.
En espèrant que la question n'a pas déjà été posée (La fonction recherche ne m'a pas permise de trouver de réponses précises à ma question).
J'aimerais savoir si l'utilisation de la syntaxe ci-dessous relative à la Meta-Tag "robots" (à placer entre les balises <head> et </head>) permettant d'indiquer aux robots des moteurs de recherche l'indextation ou non d'une page et/ou des liens hypertextes est-elle efficace dans tous les moteurs de recherches (Google, Altavista, Yahoo, etc.)
- Code: Tout sélectionner
<meta name="robots" content="noindex, nofollow">
La syntaxe ci-dessus permet par exemple d'indiquer aux robots :
- La page ne sera pas indexée par le robot grace à la valeur "noindex" ;
- Les liens contenus dans la page ne seront pas indexés grace à la valeur "nofollow".
D'ailleurs dans mon exemple, je crois qu'il est aussi possible d'écrire :
- Code: Tout sélectionner
<meta name="robots" content="none">
non ?
D'avance merci pour vos réponses.
-

WebRankInfo - Administrateur du site

- Messages: 15817
- Inscription: Ven Avr 19, 2002 19:51
tu trouveras quelques infos sur http://www.webrankinfo.com/outils/robots/faq_16_0.htm
les robots sont libres de respecter ou non cette balise. Cependant, la plupart des moteurs la respectent (j'avoue ne pas avoir vérifié chaque moteur).
De mémoire, je sais que Google et DeepIndex la respectent. Sans doute aussi tous les moteurs "majeurs".
les robots sont libres de respecter ou non cette balise. Cependant, la plupart des moteurs la respectent (j'avoue ne pas avoir vérifié chaque moteur).
De mémoire, je sais que Google et DeepIndex la respectent. Sans doute aussi tous les moteurs "majeurs".
- curieuxmann
- WRInaute discret

- Messages: 94
- Inscription: Dim Nov 23, 2003 17:34
Bonsoir,
Si j'ai bien compris, on peut aussi utiliser un fichier nommé robots.txt qu'on l'on doit normalement placer dans le répertoire racine du site.
Je prends l'exemple (j'espère que je peux ?) du fichier robots.txt trouvé dans la racine du site Internet http://www.webrankinfo.com/ :
URL : http://www.webrankinfo.com/robots.txt :
Dans le fichier robots.txt ci-dessus, tous les robots (*) sauf le robot "TurnitinBot" ont le droit d'indexer tous les répertoires et fichier (/) , sauf le répertoire «images» (Disallow: /images/), et les fichiers login.php, modcp.php, posting.php, printview.php, privmsg.php, search.php et viewonline.php tous contenus dans le répertoires forums.
Est-ce bien ça que ce fichier ordonne aux robots ?
Si j'ai bien compris, on peut aussi utiliser un fichier nommé robots.txt qu'on l'on doit normalement placer dans le répertoire racine du site.
Je prends l'exemple (j'espère que je peux ?) du fichier robots.txt trouvé dans la racine du site Internet http://www.webrankinfo.com/ :
URL : http://www.webrankinfo.com/robots.txt :
User-agent: *
Disallow: /images/
Disallow: /forums/login.php
Disallow: /forums/modcp.php
Disallow: /forums/posting.php
Disallow: /forums/printview.php
Disallow: /forums/privmsg.php
Disallow: /forums/search.php
Disallow: /forums/viewonline.php
User-agent: TurnitinBot
Disallow: /
Dans le fichier robots.txt ci-dessus, tous les robots (*) sauf le robot "TurnitinBot" ont le droit d'indexer tous les répertoires et fichier (/) , sauf le répertoire «images» (Disallow: /images/), et les fichiers login.php, modcp.php, posting.php, printview.php, privmsg.php, search.php et viewonline.php tous contenus dans le répertoires forums.
Est-ce bien ça que ce fichier ordonne aux robots ?
-

WebRankInfo - Administrateur du site

- Messages: 15817
- Inscription: Ven Avr 19, 2002 19:51
le fichier robots.txt est publique, il est consultable par tous et ne révèle rien de particulier.
la ligne User-agent: * indique qu'elle concerne tous les robots. ce qui suit indique qu'ils n'ont pas le droit d'indexer les pages listées (ou plutôt que ce n'est pas la peine qu'ils le fassent).
ensuite les 2 dernières lignes interdisent au robot TurnitinBot d'indexer quoi que ce soit. Le pb est qu'il ne respecte toujours pas cette directive, alors qu'il annonce officiellement le faire...
la ligne User-agent: * indique qu'elle concerne tous les robots. ce qui suit indique qu'ils n'ont pas le droit d'indexer les pages listées (ou plutôt que ce n'est pas la peine qu'ils le fassent).
ensuite les 2 dernières lignes interdisent au robot TurnitinBot d'indexer quoi que ce soit. Le pb est qu'il ne respecte toujours pas cette directive, alors qu'il annonce officiellement le faire...
Salut,
moi y a un truc qui m'a toujours fait rire a ce sujet, car c'est paradoxal:
Pour pouvoir lire une balise meta robots, les moteurs sont obligé de lire la page web! Sauf qu'il ne l'indexera pas si c'est ce qui est stipulé dans la balise...
C'est aussi ça la différence avec un robots.txt, qui lui est lu avant que le moteur ne crawl une page...
Bref, pour ceux qui ne veulent pas que les moteurs crawl trop souvent leur site pour cause d'économie de bande passante, le robots.txt est bcp plus indiqué...
moi y a un truc qui m'a toujours fait rire a ce sujet, car c'est paradoxal:
Pour pouvoir lire une balise meta robots, les moteurs sont obligé de lire la page web! Sauf qu'il ne l'indexera pas si c'est ce qui est stipulé dans la balise...
C'est aussi ça la différence avec un robots.txt, qui lui est lu avant que le moteur ne crawl une page...
Bref, pour ceux qui ne veulent pas que les moteurs crawl trop souvent leur site pour cause d'économie de bande passante, le robots.txt est bcp plus indiqué...
- curieuxmann
- WRInaute discret

- Messages: 94
- Inscription: Dim Nov 23, 2003 17:34
Salut,
Merci pour ton conseil. Il est vrai qu'il est très intéressant (et même nécessaire) d'économiser de la bande passante, à la fois pour le serveur, mais aussi pour le réseau en général.
Merci pour ton conseil. Il est vrai qu'il est très intéressant (et même nécessaire) d'économiser de la bande passante, à la fois pour le serveur, mais aussi pour le réseau en général.
7 messages • Page 1 sur 1
Formation recommandée sur ce thème :
Formation Google Analytics : en 2 jours, apprenez comment exploiter l'essentiel des possibilités de l'outil de mesure d'audience de Google. Formation animée par Julien Coquet, expert certifié officiellement par Google Analytics.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Yahoo Audio Search
- X-Robots-Tag : directive pour bloquer les robots dans l'entête HTTP : explications
- Sortie de GoogleStats v2.01
- Les crawlers de Yahoo!
- Les robots MSNbot de Live Search
- Déclarer son fichier sitemap dans le fichier robots.txt
- Petit changement pour Slurp (le robot de Yahoo)
- Mort du META tag "keywords"
- Robots.txt : Yahoo supporte les options avancées
- La balise meta NOYDIR de Yahoo
- méta tag "<META NAME="robots" "
- Tag "id" dans la balise "a href"
- <meta name="robots" content="noodp" /
- META NAME="ROBOTS" CONTENT="NOARCHIVE"
- Robots et la balise..."Robots"CONTENT="index,
- <meta name="robots" content="noindex, foll
- Enlever le Meta tag "Revisit-after" : une mauvaise
- Le "Nuage de mots" (tag cloud)...
- liens : rel="tag"
- Meta tag "keywords"
- Calcul d'indice de densité
Cet outil vous permet de calculer l'indice de densité d'un mot-clé d'une page web. Il est calculé à la fois pour la balise TITLE, la balise META description et l'ensemble du texte de la page.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités

le forum