Référencement de pages de résultats de recherche
19 messages
• Page 1 sur 2 • 1, 2
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
-

vinset - WRInaute discret

- Messages: 202
- Inscription: 20 Avr 2006
Référencement de pages de résultats de recherche
Bonjour,
nous avons un moteur de recherche interne dans notre site Internet, pratique pour rechercher parmis plus de 3000 produits.
J'ai lu je ne sais plus où que Google allait désindexer toutes les pages de résultats de recherche. Je suis d'accord car parfois c'est vraiment lourd quand elles ne sont pas pertinentes et qu'il ne s'agit que de liens externes.
Mais si la page est placée de façon intelligente, admettons que ma page ne parle que de chaussures et que je fais un lien sur le mot "chaussures" vers la page de résultats de notre moteur de recherche interne pour que les internautes voient toutes nos chaussures, pensez-vous que cette page a une chance d'être indexée ?
nous avons un moteur de recherche interne dans notre site Internet, pratique pour rechercher parmis plus de 3000 produits.
J'ai lu je ne sais plus où que Google allait désindexer toutes les pages de résultats de recherche. Je suis d'accord car parfois c'est vraiment lourd quand elles ne sont pas pertinentes et qu'il ne s'agit que de liens externes.
Mais si la page est placée de façon intelligente, admettons que ma page ne parle que de chaussures et que je fais un lien sur le mot "chaussures" vers la page de résultats de notre moteur de recherche interne pour que les internautes voient toutes nos chaussures, pensez-vous que cette page a une chance d'être indexée ?
-

HawkEye - WRInaute accro

- Messages: 17013
- Inscription: 23 Fév 2004
C'est à toi de trouver la limite raisonnable entre "tagging" et "spamdexing".
J'ai fait l'expérience (et les frais) d'un hyper-tagging, qui consistait en fait un une mise à disposition de pages de résultats de recherches, bien évidemment hyper-optimisées de par leur structure et leur contenu...
--> Black List
Personnellement, je ne permettrais pas l'indexation de pages générées "on the fly", et je ne ferais pas de liens vers ces pages.
Si c'est en faible quantité, tu ne risques rien, mais si on veut te nuire, c'est une porte d'entrée très facile.
Imagine qu'on identifie que tes pages de recherches indexables soient sous la forme blabla.com/guide/{mot-clé}...
Une personne mal intentionnée aura tôt fait de générer des millions de liens vers des recherches "bateau", voire nuisibles à ton site: si tu n'as pas le contrôle là dessus, tu prends un risque important.
L'alternative à ça, c'est le "tagging": tu attribues quelques mots-clés à chaque produit, manuellement ou via un script qui identifie les termes de ton contenu qui correspondent à une liste te tags "reconnus", et tu permets des recherches "facilitées", un peu à la manière d'un index à la fin d'un bouquin.
L'important est bien évidemment le contrôle du tag demandé par le visiteur: si le tag n'est pas présent dans la liste des tags "reconnus", aucun contenu ne doit être fourni (404, ou 301 vers la page la plus adéquate).
J'ai fait l'expérience (et les frais) d'un hyper-tagging, qui consistait en fait un une mise à disposition de pages de résultats de recherches, bien évidemment hyper-optimisées de par leur structure et leur contenu...
--> Black List
Personnellement, je ne permettrais pas l'indexation de pages générées "on the fly", et je ne ferais pas de liens vers ces pages.
Si c'est en faible quantité, tu ne risques rien, mais si on veut te nuire, c'est une porte d'entrée très facile.
Imagine qu'on identifie que tes pages de recherches indexables soient sous la forme blabla.com/guide/{mot-clé}...
Une personne mal intentionnée aura tôt fait de générer des millions de liens vers des recherches "bateau", voire nuisibles à ton site: si tu n'as pas le contrôle là dessus, tu prends un risque important.
L'alternative à ça, c'est le "tagging": tu attribues quelques mots-clés à chaque produit, manuellement ou via un script qui identifie les termes de ton contenu qui correspondent à une liste te tags "reconnus", et tu permets des recherches "facilitées", un peu à la manière d'un index à la fin d'un bouquin.
L'important est bien évidemment le contrôle du tag demandé par le visiteur: si le tag n'est pas présent dans la liste des tags "reconnus", aucun contenu ne doit être fourni (404, ou 301 vers la page la plus adéquate).
-

HawkEye - WRInaute accro

- Messages: 17013
- Inscription: 23 Fév 2004
Pas forcément, vinset.
L'important, c'est d'avoir le contrôle du contenu.
Le moins qu'ils puissent faire, c'est de faire en sorte par exemple que si la recherche qui est faite par l'internaute ne fait pas partie des "requêtes reconnues" (une simple liste), il soit renseigné la balise <meta name="robots" content="none" />.
--> seules les recherches "autorisées" génèrent des pages "indexables".
Il faut savoir que certains moteurs, dont Google et Yahoo, font des tests en essayant de "deviner" quelles sont les pages créées "à la volée" par vagues de tests de ce genre, où ils injectent des valeurs au hasard pour vérifier si la réponse est une 404 ou un code d'état 200.
L'important, c'est d'avoir le contrôle du contenu.
Le moins qu'ils puissent faire, c'est de faire en sorte par exemple que si la recherche qui est faite par l'internaute ne fait pas partie des "requêtes reconnues" (une simple liste), il soit renseigné la balise <meta name="robots" content="none" />.
--> seules les recherches "autorisées" génèrent des pages "indexables".
Il faut savoir que certains moteurs, dont Google et Yahoo, font des tests en essayant de "deviner" quelles sont les pages créées "à la volée" par vagues de tests de ce genre, où ils injectent des valeurs au hasard pour vérifier si la réponse est une 404 ou un code d'état 200.
-

vinset - WRInaute discret

- Messages: 202
- Inscription: 20 Avr 2006
Merci beaucoup HawkEye de cette solution qui me parait simple en effet.
Il va quand même falloir demander ce développement spécifique à la société qui s'occupe de notre moteur de recherche interne (C-e-l-e-b-r-o-s) pour 7 pays différents...
Déjà que ce n'est pas simple de leur faire comprendre qu'une redirection 302 pour compter les recherches, j'en veux pas et que je voudrais des redirections 301 sur chaque produit de la page "?ID=xxx" vers l'URL rewrité...
Il va quand même falloir demander ce développement spécifique à la société qui s'occupe de notre moteur de recherche interne (C-e-l-e-b-r-o-s) pour 7 pays différents...
Déjà que ce n'est pas simple de leur faire comprendre qu'une redirection 302 pour compter les recherches, j'en veux pas et que je voudrais des redirections 301 sur chaque produit de la page "?ID=xxx" vers l'URL rewrité...
-

vinset - WRInaute discret

- Messages: 202
- Inscription: 20 Avr 2006
Bon, en repensant à cette discussion, je me suis demandé 2 choses :
> Quelle est la différence entre
<META NAME="ROBOTS" CONTENT="NOINDEX">
et
<META NAME="ROBOTS" content="none">
?
S'il faut renvoyer un 404 aux moteurs de recherche, pour indiquer qu'il ne s'agit pas de pages crées "on the fly", l'utilisation d'une de ces balises convient-elle et renverra-t-elle vraiment un code 404 ???
Pour moi la page devrait quand même renvoyer un code 200, tout en indiquant aux moteurs de ne pas l'indexer...?
> Quelle est la différence entre
<META NAME="ROBOTS" CONTENT="NOINDEX">
et
<META NAME="ROBOTS" content="none">
?
S'il faut renvoyer un 404 aux moteurs de recherche, pour indiquer qu'il ne s'agit pas de pages crées "on the fly", l'utilisation d'une de ces balises convient-elle et renverra-t-elle vraiment un code 404 ???
Pour moi la page devrait quand même renvoyer un code 200, tout en indiquant aux moteurs de ne pas l'indexer...?
-

Monty973 - WRInaute passionné

- Messages: 1636
- Inscription: 21 Mar 2006
La page existe, il n'y a donc effectivement pas lieu de renvoyer une 404 (et ce n'est pas le but de la balise META ROBOTS de toute façon.)
Pour qu'elle ne soit pas indéxée, tu peux utiliser cette balise :
La page ne sera pas indexée et les liens ne seront pas suivis. Mais le mieux est sans doute d'interdire les pages via le fichier robots.txt, c'est d'ailleurs ce qui est recommandé dans les guidelines :
http://www.google.com/support/webmaster ... swer=35769
Pour qu'elle ne soit pas indéxée, tu peux utiliser cette balise :
- Code: Tout sélectionner
<META NAME="ROBOTS" content="none">
La page ne sera pas indexée et les liens ne seront pas suivis. Mais le mieux est sans doute d'interdire les pages via le fichier robots.txt, c'est d'ailleurs ce qui est recommandé dans les guidelines :
Utilisez robots.txt pour éviter l'exploration des pages de résultats de recherche ou d'autres pages générées automatiquement qui n'offrent pas d'intérêt particulier pour les internautes provenant de moteurs de recherche.
http://www.google.com/support/webmaster ... swer=35769
-

vinset - WRInaute discret

- Messages: 202
- Inscription: 20 Avr 2006
Merci,
mais quelle est la différence avec la balise META ROBOT NOINDEX ?
Et si on met la page de recherche dans le robot.txt, on pourra en effet mettre l'url de la home du moteur de recherche interne domaine.fr/recherche.php, mais comment empêcher toutes les URL qui peuvent se créer à la volée du genre domaine.fr/recherche.php?query=mot-clé ou domaine.fr/recherche.php?query=autre-exemple-de-mot-clé ?
mais quelle est la différence avec la balise META ROBOT NOINDEX ?
Et si on met la page de recherche dans le robot.txt, on pourra en effet mettre l'url de la home du moteur de recherche interne domaine.fr/recherche.php, mais comment empêcher toutes les URL qui peuvent se créer à la volée du genre domaine.fr/recherche.php?query=mot-clé ou domaine.fr/recherche.php?query=autre-exemple-de-mot-clé ?
-

Bobez - WRInaute impliqué

- Messages: 716
- Inscription: 20 Mai 2004
La seule manière que je vois de faire ça, c'est d'utiliser une url dotée d'un répertoire "virtuel", par exemple domaine.fr/recherche/mot-cle.
Comme ça, tu peux faire un simple Disallow: /recherche/
Et pour les pages que tu veux faire indexer, choisir une autre syntaxe d'url via urlrewriting... Bref, c'est un peu le bordel.
Sur mon site, je passe par la balise meta.
Et pour ta première question, le "none" signifie en fait noindex + nofollow + noarchive.
Comme ça, tu peux faire un simple Disallow: /recherche/
Et pour les pages que tu veux faire indexer, choisir une autre syntaxe d'url via urlrewriting... Bref, c'est un peu le bordel.
Et pour ta première question, le "none" signifie en fait noindex + nofollow + noarchive.
-

HawkEye - WRInaute accro

- Messages: 17013
- Inscription: 23 Fév 2004
vinset a écrit:mais quelle est la différence avec la balise META ROBOT NOINDEX ?
Et si on met la page de recherche dans le robot.txt, on pourra en effet mettre l'url de la home du moteur de recherche interne domaine.fr/recherche.php, mais comment empêcher toutes les URL qui peuvent se créer à la volée?
La balise <meta name="robots" supporte différents content="":
- noindex (ne pas indexer la page)
- nofollow (ne pas considérer les liens)
- noarchive (ne pas mettre en cache)
et "none", qui correspond à "noindex, nofollow, noarchive".
les réponses "positives" existent également (index, follow, archive), mais comme ce sont les valeurs par défaut, il n'est pas nécessaire de les renseigner (cette balise n'a de valeur que restrictive
Pour robots.txt, si tu fais un Disallow: /recherche.php, recherche.php?foo=bar est bloqué aussi !
- Zipoups
- Nouveau WRInaute

- Messages: 16
- Inscription: 7 Juil 2005
Bonjour,
Je suis quasiment dans la même configuration que vinset. En résumé, je travaille sur un site e-commerce avec plus de 5500 produits en vente et environ 26 000 pages référencés. En terme de SEO, on est plutôt bien placé sur notre coeur de métier, et le site en lui même est optimisé selon les règles.
Dans cette continuité, on souhaite créer un annuaire de requête hierarchisé et structuré (on ne souhaite pas faire une page avec 14 000 mots clés au singulier, pluriel, avec fautes d'ortographe etc... le but est d'avoir une url propre pour chaque famille et sous famille de produit, ex : Cheval > Cheval Blanc > Cheval blanc à roulette). pour référencer les pages search interne au site.
Le développement de l'outil est déjà fait, il n'est pas encore en ligne mais il est opérationnel.
On alimenterait donc progressivement cette base en fonction de la pertinence des pages de recherche que l'on ferait nous même, afin que les moteurs puissent mieux indexer ces "tags" et accessoirement cet annuaire de pages search pourrait aussi servir à l'internaute. Il serait présenté sous forme de glossaire ou de lexique, trié par lettre (A, B, C, D, E etc...). On limiterait évidemment le nombre de lien par page (à combien ? si on suit les conseils de Google). Ma crainte est de générer des pages avec une liste de liens qui s'enchaînent, et que les moteurs n'apprécient pas la démarche.
Quels conseils donneriez-vous pour que cela se fasse de la manière la plus naturelle possible ? Le but étant d'améliorer le linking interne et par conséquent le référencement à terme, pas de le plomber
Je suis quasiment dans la même configuration que vinset. En résumé, je travaille sur un site e-commerce avec plus de 5500 produits en vente et environ 26 000 pages référencés. En terme de SEO, on est plutôt bien placé sur notre coeur de métier, et le site en lui même est optimisé selon les règles.
Dans cette continuité, on souhaite créer un annuaire de requête hierarchisé et structuré (on ne souhaite pas faire une page avec 14 000 mots clés au singulier, pluriel, avec fautes d'ortographe etc... le but est d'avoir une url propre pour chaque famille et sous famille de produit, ex : Cheval > Cheval Blanc > Cheval blanc à roulette). pour référencer les pages search interne au site.
Le développement de l'outil est déjà fait, il n'est pas encore en ligne mais il est opérationnel.
On alimenterait donc progressivement cette base en fonction de la pertinence des pages de recherche que l'on ferait nous même, afin que les moteurs puissent mieux indexer ces "tags" et accessoirement cet annuaire de pages search pourrait aussi servir à l'internaute. Il serait présenté sous forme de glossaire ou de lexique, trié par lettre (A, B, C, D, E etc...). On limiterait évidemment le nombre de lien par page (à combien ? si on suit les conseils de Google). Ma crainte est de générer des pages avec une liste de liens qui s'enchaînent, et que les moteurs n'apprécient pas la démarche.
Quels conseils donneriez-vous pour que cela se fasse de la manière la plus naturelle possible ? Le but étant d'améliorer le linking interne et par conséquent le référencement à terme, pas de le plomber
-

WebRankInfo - Administrateur du site

- Messages: 19420
- Inscription: 19 Avr 2002
pourquoi serais-tu obligé de créer des pages (sans aucun contenu qui ne soit déjà publié ailleurs) ? tu ne peux pas lier les pages actuelles entre elles ?
- darmond.j
- WRInaute occasionnel

- Messages: 347
- Inscription: 18 Fév 2007
vinset a écrit:mais comment empêcher toutes les URL qui peuvent se créer à la volée du genre domaine.fr/recherche.php?query=mot-clé ou domaine.fr/recherche.php?query=autre-exemple-de-mot-clé ?
Hello
En faisant comme ça :
- Code: Tout sélectionner
User-Agent: *
Disallow: /recherche.php?query=*
Allow: /
Mais pour être sûr tu peux tester dans ton WT
-

UsagiYojimbo - WRInaute accro

- Messages: 8579
- Inscription: 23 Nov 2005
WebRankInfo a écrit:pourquoi serais-tu obligé de créer des pages (sans aucun contenu qui ne soit déjà publié ailleurs) ? tu ne peux pas lier les pages actuelles entre elles ?
+1
Ou alors mettre en place des systèmes, sur la page d'accueil, d'affichage des derniers produits entrés, des meilleurs ventes, etc... tout ce qui permet dès la page d'accueil de favoriser l'indexation des pages internes.
19 messages
• Page 1 sur 2 • 1, 2
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Un moteur de recherche qui enregistre les résultats améliore le référencement ?
- Résultats indentés dans les resultats de recherche ...
- Référencement des pages des résultats d'un moteur de recherche interne
- Résultats de recherche
- PR et résultats de recherche.
- Résultats de la recherche
- Colorisation résultats de recherche
- Résultats de recherche traduits
- Résultats recherche indexées
- Résultats de recherche tronqués?
- Le secret des doubles-résultats - 22-10-2004
- Google facilite l'affichage de + de 2 résultats par sous-domaine (clustering) - 31-07-2009
- Google API : guide de développement de l'API Google - 20-09-2002
- Résultats financiers de Google : 4ème trimestre 2007 - 01-02-2008
- Résultats financiers de Google au 3ème trimestre 2008 : pas de crise chez Google ! - 17-10-2008
- Résultats financiers de Google en 2006 - 01-02-2007
- Recherche dans l'actualité WebRankInfo - 22-10-2005
- Actualités du moteur d'Orange (Voila.fr et lemoteur.fr) - 03-09-2009
Consultez la description détaillée des produits ou services de Google suivants : Google Sandbox
- Analyse du positionnement
AgentWebRanking est un logiciel professionnel qui permet d'analyser le positionnement d'un ou plusieurs sites dans plus de 300 moteurs de recherche dans le monde. Vous pouvez ainsi analyser les performances du référencement pour de nombreux mots-clés. - Analyse du référencement Google
Cet outil vous donne un petit résumé de l'état de référencement de votre site dans Google. - Transformer des simples citations de votre site en liens
Cet outil vous permet de trouver des pages citant votre site mais ne faisant pas (encore) de lien. Il suffira parfois d'un simple mail pour transformer cette simple citation en lien (backlink). - Analyse du positionnement dans Google
Cet outil vous permet de vérifier si une ou plusieurs page(s) de votre site arrive(nt) dans les premiers résultats de Google, pour certains mots-clés recherchés.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités
