Indéxation de pages non désiré

Nouveau WRInaute
Bonsoir à tous :)

Tout d'abord, j'espère ne pas me tromper de forum, si tel est le cas, navré d'avance.

Autrement, j'ai récemment réalisé le site d'un client, mais lorsqu'on tape recrut-innov.fr directement sur google, une page "super user" semble être indéxée comme vous pouvez le voir sur cette image :

uOtGvXQ.png


Bien entendu, c'est fort fâcheux car déjà on voit mon visage (avatar par défaut récupéré je ne sais plus où) et en gros c'est une page qui liste les différentes pages visiblement rédigées par moi-même.

Comment corriger cela ?
N'étant pas du tout référenceur... :/

Merci d'avance.
 
WRInaute impliqué
il y a moyen, dans gwt, de rétrograder cette page des liens de site.
après, il faut voir si les pages de ce type doivent être indexées.
 
Nouveau WRInaute
J'ai ajouté ces 3 lignes dans le fichier robots.txt :

Disallow: /superuser/
Disallow: /search/
Disallow: /itemlist/

Le site est basé sur Joomla 3 au fait, vous pensez que c'est suffisant ?

Edition : J'ai rétrogradé pas mal de liens mais tout à la main j'en aurait pour une éternité...
Les liens qui posent généralement problème se composent ainsi : http://www.recrut-innov.fr/index.php/temoignages/itemlist/user/803-superuser
Je voudrais bloquer tous les liens à partir de /itemlist/ car c'est toujours ça qui pose soucis.

Via "Pour ce résultat de recherche", je met : http://www.recrut-innov.fr/index.php/temoignages/itemlist/
Mais il me dit "Nous n'avons pas pu rétrograder votre lien sitelink, car il ne s'agit pas d'une URL valide."... :(
 
Membre Honoré
Bonjour,

Le robots.txt c'est pour interdire le crawl, il est mieux d'utiliser le noindex sur la page à ne pas indexer.

Cordialement.
 
Nouveau WRInaute
Bonjour,

J'ai demandé la suppression / rétrogradage de pas mal de liens non désirés via GWT mais le problème persiste... le résultat indiqué dans mon message initial (+ image) est toujours le même.
 
Nouveau WRInaute
Bonjour,

Je me permet de relancer le sujet car le problème persiste même après application de vos directives... :/
 
Membre Honoré
Bonjour,

Ici les liens ne sont plus les mêmes, ce ne sont pas les mêmes qu'avant.
Vous pouvez vérifier avec GWT si les liens sont bien rétrogradés.

Cordialement.
 
Nouveau WRInaute
Bonjour :)

Oui effectivement certains liens ont changés, du moins l'ordre d'apparition mais sinon ce sont des liens dont j'ai déjà demandé la suppression / rétrogradation... :/

Mais concrètement, n'y a t-il pas moyen de virer tous les liens à partir de /itemlist/ ?
Exemple : http://www.recrut-innov.fr/index.php/temoignages/itemlist/category/5-m ... -recherche
Le lien ci-dessus comporte le fameux /itemlist/ (qui est la source de tous les liens bizarres), le but serait de dire au moteur de recherche de ne pas indexer (et supprimer les liens actuellement indexés) tous les liens à partir de /itemlist/, est-ce possible ?
 
Membre Honoré
Bonjour,

Vous pouvez désindexer des pages si vous le souhaitez, mais déjà vérifier si avec les outils pour webmasters de Google cela fonctionne (vérifier si c'est bien fait).

Cordialement.
 
WRInaute accro
Talion a dit:
Mais concrètement, n'y a t-il pas moyen de virer tous les liens à partir de /itemlist/
La bonne solution c'est la meta noindex sur toutes les pages qu'on souhaite masquer aux moteurs mais pour cela faut se creuser un peut car c'est pas forcement dispo en natif dans joomla.
 
Nouveau WRInaute
@Madrileno : C'est déjà fait.

@Zeb : Via Joomla je ne peux pas car ce ne sont pas des pages que j'ai créées, et encore moins associées au menu. Par conséquent, impossible d'utiliser le noindex (du moins via Joomla) :/
 
Nouveau WRInaute
C'est à dire ?

Parce que même si avec GWT j'arrive pas à virer les liens, je ne vois pas comment je pourrais m'y prendre... :/
 
WRInaute impliqué
il faut modifier des fichiers de joomla, pour mettre ce noindex, ou supprimer les liens vers ces pages si c'est mieux qu'elles n'y soient pas.
 
WRInaute discret
Talion a dit:
@Zeb : Via Joomla je ne peux pas car ce ne sont pas des pages que j'ai créées, et encore moins associées au menu. Par conséquent, impossible d'utiliser le noindex (du moins via Joomla) :/

puisque tu ne peux le faire avec le CMS, fais le dans le header de ton thème

à l'endroit où le META ROBOTS est calculé, teste $_SERVER["QUERY_STRING"] et regarde si ton itemindex s'y trouve. dans ce cas tu mets le NOINDEX, dans le cas contraire tu laisses Joomla se dépatouiller
 
Nouveau WRInaute
Bonjour :)

@baud74 : niveau noindex j'ai mis ça dans le fichiers robots.txt
User-agent: *
Disallow: /administrator/
Disallow: /bin/
Disallow: /cache/
Disallow: /cli/
Disallow: /components/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /layouts/
Disallow: /libraries/
Disallow: /logs/
Disallow: /media/
Disallow: /modules/
Disallow: /plugins/
Disallow: /templates/
Disallow: /tmp/
Disallow: /superuser/
Disallow: /search/
Disallow: /itemlist/

@pprem : comment je procède pour effectuer ce test ? Navré encore une fois mais ça ne me parle vraiment pas tout ça :/
 
Nouveau WRInaute
@Madri' : J'ai bien compris mais ces pages en question, je ne les ai pas créées... je n'ai aucun contrôle sur ces dernières via Joomla.
C'est pour ça que je demande s'il existe un moyen de les virer définitivement du référencement Google. Vous m'avez proposé des solutions que j'ai appliqué, mais elles ne fonctionnent pas. J'ai beau fouiller internet à le recherche d'éléments de réponse, rien :(
 
WRInaute accro
La meilleure solution consiste à gérer ça directement dans le template, via le code. bauf74 donnent quelques pistes de dev un peu plus haut...
 
Nouveau WRInaute
Sauf que je ne suis en rien développeur :)
Je vais voir avec un ami qui est dév' mais il n'est pas référenceur donc bon...
 
Nouveau WRInaute
Mais, en quoi mettre une balise no-index règlera le soucis ? Encore une fois, ces pages n'existent pas concrètement.
Je lui ai envoyé un message dans la journée, j'attend sa réponse et je continue de chercher aussi en parallèle quand j'ai le temps.
 
WRInaute accro
Si les pages renvoient une entête 200, techniquement elles existent. D'autant plus s'il existe des liens dans le code source vers celles-ci.
 
WRInaute accro
Talion a dit:
Mais, en quoi mettre une balise no-index règlera le soucis ? Encore une fois, ces pages n'existent pas concrètement.
Et ça c'est quoi ? > -http://www.recrut-innov.fr/index.php/temoignages/itemlist/user/803-superuser

Si tu souhaite qu'une page qui existe par je ne sais quel artifice ne soit pas indexée il faut lui mettre une meta noindex et c'est tout. Pour cela il faut introduire une condition dans le template des pages afin de produire la noindex quand le type de page en question est demandée. C'est une histoire de code pas de référencement.

Maintenant pourquoi elles ont été découverte et indexées c'est une autre histoire

Bon après Joomla c'est pas terrible niveau code on a rien sans rien faut pas s'étonner. C'est bien pour les débutants faut pas non plu s'attendre a faire des chose pro et sérieuses avec ça sans mettre les mains sous le capot.
 
Nouveau WRInaute
@UsagiYojimbo : Par "exister" je veux dire que elles n'ont pas été créées par mes soins, elles ont été découvertes comme dit Zeb par Google et indéxées :)

@Zeb : Bah ça c'est une page de merde dont je veux me débarasser :D

Je suis en train d'exposer le soucis à mon ami dév', il m'a dit connaitre quelques rudiments du référencement donc avec un peu de chance, il trouvera quoi faire et saura où placer cette fameuse balise.

Tu es dur avec Joomla, ce n'est pas un CMS aussi dégueulasses que ça. Quel CMS préconiserais-tu dans ce cas ?
 
WRInaute accro
Je ne travaille quasi qu'avec du code perso ou au pire du Wordpress mais c'est anecdotique. Je ne suis pas dur avec Joomla je suis codeur et quand on plonge dans le code c'est comme si tu sautais dans une fausse septique pas dans la grande bleu.
 
Nouveau WRInaute
Hahaha n'étant pas codeur, je ne peux pas te dire mais pourtant, j'ai un (autre) ami dév' et il adore Joomla, plus que Wordpress d'ailleurs.
Après, si j'utilise un CMS c'est parce que le budget du client ne permet pas le développement d'un site "sur-mesure".
Et Joomla de base est nettement plus versatile que WP en terme de positionnement des modules.
 
Nouveau WRInaute
Hello :)

Bon, mon développeur n'arrive plus à se connecter sur le FTP (moi si pourtant), nous avons tous deux regardé dans le composant directement s'il n'y avait pas une option pour résoudre le problème, rien.
J'ai en parallèle demandé sur le forum du composant concerné : "These are pages Google has crawled, Google works this way.
I do not think they can be removed. ".

Du coup, nous avons pensé à simplement mettre en place une redirection de toutes les pages contenant /itemlist/ vers la page d'accueil via un fichier .htaccess avec, je cite, "un code status de 302, pour éviter l'indexation des crawlers".

Pensez-vous que ce soit une bonne idée ?
 
Nouveau WRInaute
Ah, on me chuchote dans mon oreillette qu'il s'agit du code 301 et non 302 pour une redirection permanente... :p

Navré mais je ne peux éditer mes messages.
 
Membre Honoré
Bonjour,

En complément :
- Ici le sitelink n'affiche plus le super user, page de contact ... mais simplement les prestations et clients
- Boucle avec le lien de la page : Formation - Accompagnement - Outplacement - Recrut-Innov (résultat affiché dans Google)
- Pareil pour la boucle avec la page : Prestations candidat Recrut-innov - Outplacement Paris (idem)
- Vérifier les autres pages avec /itemlist/ il semble y avoir un bug

Cordialement.
 
Nouveau WRInaute
Bonsoir :)

@Madrileño :
- Le sitelink a changé en effet, je ne sais trop comment ni pourquoi. Une bonne chose malgré tout.
- Pas compris l'histoire des boucles.
- Quel bug ?

@web proxy : déjà mis en place pour la plupart des pages indésirables ;)

Autrement, nous avons "résolu" le problème de manière assez drastique en plaçant cette règle dans le .htaccess :
RewriteRule ^index.php/(.*)/item(list)? /index.php [R=301]

Redirection générale pour TOUTES les pages contenants /item/ ou /itemlist/ en espérant un désindéxage de ces dernières malgré tout.

On peut considérer le problème comme résolu, merci à tous ceux qui ont tenté de résoudre ce problème ;)
 
Discussions similaires
Haut