Méta-tag "robots"
7 messages
• Page 1 sur 1
Consultez la formation à Google Analytics de WebRankInfo / Ranking Metrics
- curieuxmann
- WRInaute discret

- Messages: 94
- Inscription: 23 Nov 2003
Méta-tag "robots"
Bonsoir,
En espèrant que la question n'a pas déjà été posée (La fonction recherche ne m'a pas permise de trouver de réponses précises à ma question).
J'aimerais savoir si l'utilisation de la syntaxe ci-dessous relative à la Meta-Tag "robots" (à placer entre les balises <head> et </head>) permettant d'indiquer aux robots des moteurs de recherche l'indextation ou non d'une page et/ou des liens hypertextes est-elle efficace dans tous les moteurs de recherches (Google, Altavista, Yahoo, etc.)
La syntaxe ci-dessus permet par exemple d'indiquer aux robots :
- La page ne sera pas indexée par le robot grace à la valeur "noindex" ;
- Les liens contenus dans la page ne seront pas indexés grace à la valeur "nofollow".
D'ailleurs dans mon exemple, je crois qu'il est aussi possible d'écrire :
non ?
D'avance merci pour vos réponses.
En espèrant que la question n'a pas déjà été posée (La fonction recherche ne m'a pas permise de trouver de réponses précises à ma question).
J'aimerais savoir si l'utilisation de la syntaxe ci-dessous relative à la Meta-Tag "robots" (à placer entre les balises <head> et </head>) permettant d'indiquer aux robots des moteurs de recherche l'indextation ou non d'une page et/ou des liens hypertextes est-elle efficace dans tous les moteurs de recherches (Google, Altavista, Yahoo, etc.)
- Code: Tout sélectionner
<meta name="robots" content="noindex, nofollow">
La syntaxe ci-dessus permet par exemple d'indiquer aux robots :
- La page ne sera pas indexée par le robot grace à la valeur "noindex" ;
- Les liens contenus dans la page ne seront pas indexés grace à la valeur "nofollow".
D'ailleurs dans mon exemple, je crois qu'il est aussi possible d'écrire :
- Code: Tout sélectionner
<meta name="robots" content="none">
non ?
D'avance merci pour vos réponses.
-

WebRankInfo - Administrateur du site

- Messages: 18956
- Inscription: 19 Avr 2002
tu trouveras quelques infos sur http://www.webrankinfo.com/outils/robots/faq_16_0.htm
les robots sont libres de respecter ou non cette balise. Cependant, la plupart des moteurs la respectent (j'avoue ne pas avoir vérifié chaque moteur).
De mémoire, je sais que Google et DeepIndex la respectent. Sans doute aussi tous les moteurs "majeurs".
les robots sont libres de respecter ou non cette balise. Cependant, la plupart des moteurs la respectent (j'avoue ne pas avoir vérifié chaque moteur).
De mémoire, je sais que Google et DeepIndex la respectent. Sans doute aussi tous les moteurs "majeurs".
- curieuxmann
- WRInaute discret

- Messages: 94
- Inscription: 23 Nov 2003
Bonsoir,
Si j'ai bien compris, on peut aussi utiliser un fichier nommé robots.txt qu'on l'on doit normalement placer dans le répertoire racine du site.
Je prends l'exemple (j'espère que je peux ?) du fichier robots.txt trouvé dans la racine du site Internet http://www.webrankinfo.com/ :
URL : http://www.webrankinfo.com/robots.txt :
Dans le fichier robots.txt ci-dessus, tous les robots (*) sauf le robot "TurnitinBot" ont le droit d'indexer tous les répertoires et fichier (/) , sauf le répertoire «images» (Disallow: /images/), et les fichiers login.php, modcp.php, posting.php, printview.php, privmsg.php, search.php et viewonline.php tous contenus dans le répertoires forums.
Est-ce bien ça que ce fichier ordonne aux robots ?
Si j'ai bien compris, on peut aussi utiliser un fichier nommé robots.txt qu'on l'on doit normalement placer dans le répertoire racine du site.
Je prends l'exemple (j'espère que je peux ?) du fichier robots.txt trouvé dans la racine du site Internet http://www.webrankinfo.com/ :
URL : http://www.webrankinfo.com/robots.txt :
User-agent: *
Disallow: /images/
Disallow: /forums/login.php
Disallow: /forums/modcp.php
Disallow: /forums/posting.php
Disallow: /forums/printview.php
Disallow: /forums/privmsg.php
Disallow: /forums/search.php
Disallow: /forums/viewonline.php
User-agent: TurnitinBot
Disallow: /
Dans le fichier robots.txt ci-dessus, tous les robots (*) sauf le robot "TurnitinBot" ont le droit d'indexer tous les répertoires et fichier (/) , sauf le répertoire «images» (Disallow: /images/), et les fichiers login.php, modcp.php, posting.php, printview.php, privmsg.php, search.php et viewonline.php tous contenus dans le répertoires forums.
Est-ce bien ça que ce fichier ordonne aux robots ?
-

WebRankInfo - Administrateur du site

- Messages: 18956
- Inscription: 19 Avr 2002
le fichier robots.txt est publique, il est consultable par tous et ne révèle rien de particulier.
la ligne User-agent: * indique qu'elle concerne tous les robots. ce qui suit indique qu'ils n'ont pas le droit d'indexer les pages listées (ou plutôt que ce n'est pas la peine qu'ils le fassent).
ensuite les 2 dernières lignes interdisent au robot TurnitinBot d'indexer quoi que ce soit. Le pb est qu'il ne respecte toujours pas cette directive, alors qu'il annonce officiellement le faire...
la ligne User-agent: * indique qu'elle concerne tous les robots. ce qui suit indique qu'ils n'ont pas le droit d'indexer les pages listées (ou plutôt que ce n'est pas la peine qu'ils le fassent).
ensuite les 2 dernières lignes interdisent au robot TurnitinBot d'indexer quoi que ce soit. Le pb est qu'il ne respecte toujours pas cette directive, alors qu'il annonce officiellement le faire...
- Blastboy
- Nouveau WRInaute

- Messages: 25
- Inscription: 5 Nov 2003
Salut,
moi y a un truc qui m'a toujours fait rire a ce sujet, car c'est paradoxal:
Pour pouvoir lire une balise meta robots, les moteurs sont obligé de lire la page web! Sauf qu'il ne l'indexera pas si c'est ce qui est stipulé dans la balise...
C'est aussi ça la différence avec un robots.txt, qui lui est lu avant que le moteur ne crawl une page...
Bref, pour ceux qui ne veulent pas que les moteurs crawl trop souvent leur site pour cause d'économie de bande passante, le robots.txt est bcp plus indiqué...
moi y a un truc qui m'a toujours fait rire a ce sujet, car c'est paradoxal:
Pour pouvoir lire une balise meta robots, les moteurs sont obligé de lire la page web! Sauf qu'il ne l'indexera pas si c'est ce qui est stipulé dans la balise...
C'est aussi ça la différence avec un robots.txt, qui lui est lu avant que le moteur ne crawl une page...
Bref, pour ceux qui ne veulent pas que les moteurs crawl trop souvent leur site pour cause d'économie de bande passante, le robots.txt est bcp plus indiqué...
- curieuxmann
- WRInaute discret

- Messages: 94
- Inscription: 23 Nov 2003
Salut,
Merci pour ton conseil. Il est vrai qu'il est très intéressant (et même nécessaire) d'économiser de la bande passante, à la fois pour le serveur, mais aussi pour le réseau en général.
Merci pour ton conseil. Il est vrai qu'il est très intéressant (et même nécessaire) d'économiser de la bande passante, à la fois pour le serveur, mais aussi pour le réseau en général.
7 messages
• Page 1 sur 1
Formation recommandée sur ce thème :
Formation Google Analytics : en 2 jours, apprenez comment exploiter l'essentiel des possibilités de l'outil de mesure d'audience de Google. Formation animée par les experts Google Analytics de Ranking Metrics.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- sa sert à quoi ces méta tag <META NAME="dc.descripti
- Enlever le Meta tag "Revisit-after" : une mauvaise
- méta tag "<META NAME="robots" "
- Meta tag "keywords"
- Tag Méta à la place du tag Description
- Page "Catégorie" et "Tag" dans un blog pas indexée
- Différences entre <meta http-equiv="description"...> et <meta content="description"...> ?
- Tag "id" dans la balise "a href"
- Pb Meta tag
- Meta Tag
- l'attribut rel=nofollow contre le spam de commentaires ?
- Mort du META tag "keywords"
- Optimiser le référencement d'un blog Dotclear : balises TITLE et META
- Balises meta et référencement : les bases à savoir
- Google AdWords introduit le concept de niveau de qualité
- Séminaires Google et Netlinking - 6 et 7 octobre 2004
- Google reconnait-il les différentes formes de mots ? (singulier/pluriel et autres)
- Comment indiquer une URL canonique dans l'entête HTTP
- Calcul d'indice de densité
Cet outil vous permet de calculer l'indice de densité d'un mot-clé d'une page web. Il est calculé à la fois pour la balise TITLE, la balise META description et l'ensemble du texte de la page.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités
