Url rewriting et duplicate content : arbitrage des ressources

Règles du forum
Attention ce forum est destiné avant tout à ceux qui découvrent le référencement. Les membres qui auront l'amabilité de répondre à leurs questions sont priés de rester courtois, polis, indulgents, patients et pédagogues... Merci d'avance !

Par ailleurs, inutile d'utiliser ce forum uniquement pour obtenir des liens vers vos sites, les liens sont désactivés pour le référencement (nofollow).

Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics

maxime!
WRInaute discret
WRInaute discret
 
Messages: 57
Inscription: 9 Fév 2005

Url rewriting et duplicate content : arbitrage des ressources

Message le Mar Juin 22, 2010 9:21

Bonjour,

Je suis en train de bosser sur la nouvelle ré-écriture des urls d'un de mes sites, et je suis confronté à un problème que j'ai remarqué et qui est présent sur vraiment beaucoup de sites web.

Un exemple valant mieux qu'un long discours, voici le site démo de prestashop :
www.prestashop.com/demo/3-accessoires-ipod

L'url rewriting utilise le premier chiffre, et donc ceci renvoi la même page :
www.prestashop.com/demo/3-accessoires-ipppppppppppppppod

Bien sûr c'est un cas de duplicate content et bien sûr il existe un moyen de contrer cela en vérifiant que l'url saisie soit la bonne.
Cependant, cette vérification a un coût (selon la page affichée 1 ou 2 requêtes sql avec jointure), et un impact sur la vitesse du site web, celui-ci étant chargé, cela un impact significatif aux heures de pointe.
Il y a donc un impact négatif, pas insurmontable bien sûr, mais il existe.

J'en appelle donc à WRI pour mieux connaitre les impacts négatifs du duplicate content évoqué.
Clairement, ces urls à erreur n'apparaitront que si quelqu'un fait un lien vers le site en introduisant l'erreur. Il faudrait taper manuellement l'url au lieu d'un copié-collé. A mon sens, le cas sera donc suffisamment rare pour ne pas justifier les requêtes sql supplémentaires car le risque de problème causé par le duplicate content sera quasiment nul.

Qu'en pensez vous ?
Merci de vos avis.

silef
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 317
Inscription: 13 Jan 2006

Re: Url rewriting et duplicate content : arbitrage des ressources

Message le Mar Juin 22, 2010 11:46

J'ai été confronté a ce soucis et il existe une solution intermédiaire qui consiste a ne faire cette vérification avec redirection que pour les bots car après tout ce sont eux qui indexent et doivent avoir la véritable url et pas une douzaine de versions possibles pour la même page.


HawkEye
WRInaute accro
WRInaute accro
 
Messages: 17013
Inscription: 23 Fév 2004

Re: Url rewriting et duplicate content : arbitrage des ressources

Message le Mar Juin 22, 2010 11:52

maxime! a écrit:Cependant, cette vérification a un coût (selon la page affichée 1 ou 2 requêtes sql avec jointure), et un impact sur la vitesse du site web, celui-ci étant chargé, cela un impact significatif aux heures de pointe.


Crois-tu vraiment qu'une requête sur une clé primaire au format INT() soit si lourde ?
Qui plus est: la requête est la plupart du temps déjà faite... tu dois de toutes façons aller chercher le nom du produit pour l'afficher sur la page... donc un petit passage par ta fonction d'assainissement, une comparaison avec l'URI, et une redirection vers l'URI de contrôle... et le tour est joué ;)

Je fais cette vérification sur mes sites, qu'il s'agisse d'URLs avec une clé numérique, ou de clés sous forme de "slugs": je n'ai pas constaté de ralentissement ;)

maxime!
WRInaute discret
WRInaute discret
 
Messages: 57
Inscription: 9 Fév 2005

Re: Url rewriting et duplicate content : arbitrage des ressources

Message le Jeu Juil 01, 2010 10:43

Merci pour vos avis et commentaires :)


Si vous avez aimé cette discussion, partagez-la sur vos réseaux sociaux préférés :

Formation recommandée sur ce thème :

Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :

Consultez la description détaillée des produits ou services de Google suivants : Google goo.gl

  • Détection de pages similaires
    Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages). Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation... Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués.


Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 1 invité