Messages: 4

Enregistré le: 3 Juin 2009

Message le Sam Mai 23, 2015 16:41

Bonjour à tous et à toutes,

Je viens de trouver un problème de duplicate content que je n'arrive pas à résoudre sur notre site (Prestashop), et j'aurais aimé avoir votre avis svp:

Voilà J'ai trouvé dans google webmaster tools> améliorations HTML 5330 balises meta et balises title en double.
La premiere ligne est le nom du produit et la deuxieme ligne correspond au même produit mais se terminant par "?content_only=1"
ex :
site.com/pneus/pneujoli.html
site.com/pneus/pneujoli.html?content_only=1

J'ai rajouté un disallow "?content_only=" dans le robots txt avec cette forme ci-dessous :
User-agent: Googlebot
Disallow: /*orderby=
Disallow: /*orderway=
Disallow: /*tag=
Disallow: /*id_currency=
Disallow: /*search_query=
Disallow: /*id_lang=
Disallow: /*back=
Disallow: /*utm_source=
Disallow: /*utm_medium=
Disallow: /*utm_campaign=
Disallow: /*n=
Disallow: /*content_only=
Disallow: /*nosto=

J'ai indiqué à dans GWT de ne pas surveiller les urls ?content_only=1 dans le menu Exploration >parametre d'urls en mettant "aucune"

Je renvoie le sitemap pour indexation depuis le module "google sitemap"dans prestashop, et ai resoumis le robots.txt depuis GWT pour modification, et depuis rien n'a bougé, environ 2 semaines.
Avez-vous une idée?

Dans l'attente de vous lire
Merci d'avance

Alex
Haut
5 Réponses
Messages: 12288

Enregistré le: 23 Nov 2005

Message le Sam Mai 23, 2015 17:08

Le problème du disallow, c'est que ce faisant tu empêche le bot d'accéder à la page, et ainsi de la désindexer. Il vaudrait mieux partir sur un système de canonical, voire sur du noindex:.
Haut
Messages: 4

Enregistré le: 3 Juin 2009

Message le Lun Mai 25, 2015 20:00

Je vais voir pour le Noindex,
Ca veut dire que je devrai plutôt faire le no index dans le Ht access?
Merci de ton aide
Haut
Messages: 4

Enregistré le: 3 Juin 2009

Message le Mar Mai 26, 2015 9:31

Je repensais à comment faire pour retirer ce dual content:

Estce que le fait le mettre le paramètre "aucune url" dans GWT Exploration>parametre d'url correspond à du "No Index"?

Paramètre URL surveillées Dernière configuration Effet Exploration
content_only 4 413 09:23 (Il y a 5 minutes) - Aucune URL

Si ce n'est pas ça, est-ce que le canonical et le No follow doit être mis sur chacune des 5300 pages ou y'a il une méthode globale?
Merci de ta réponse
A bientôt
Haut
Messages: 872

Enregistré le: 19 Fév 2003

Message le Mar Mai 26, 2015 18:02

il y a une différence pour le client avec et sans ce paramètre ?
si non, alors déjà trouver pourquoi cela apparait et y remédier.

une canonical url est une solution, et il suffit de toujours la mettre, ce qui peut être plus simple pour un non programmeur de ne faire quelque chose que si ce paramètre est présent.
Haut
Messages: 4

Enregistré le: 3 Juin 2009

Message le Mer Mai 27, 2015 11:27

loubet a écrit:il y a une différence pour le client avec et sans ce paramètre ?
si non, alors déjà trouver pourquoi cela apparait et y remédier.

une canonical url est une solution, et il suffit de toujours la mettre, ce qui peut être plus simple pour un non programmeur de ne faire quelque chose que si ce paramètre est présent.


Salut Loubet,

En fait oui il y'a une différence car les pages se terminant par "content_only=1 sont tronquées et apparaissent n'importe comment à l'écran. Ma question si je le modifie le paramètre "aucune url" dans GWT Exploration>parametre d'url ça edvrait suffire non?

A bientôt
Haut