Bonjour,
Je suis en train de bosser sur la nouvelle ré-écriture des urls d'un de mes sites, et je suis confronté à un problème que j'ai remarqué et qui est présent sur vraiment beaucoup de sites web.
Un exemple valant mieux qu'un long discours, voici le site démo de prestashop :
www.prestashop.com/demo/3-accessoires-ipod
L'url rewriting utilise le premier chiffre, et donc ceci renvoi la même page :
www.prestashop.com/demo/3-accessoires-ipppppppppppppppod
Bien sûr c'est un cas de duplicate content et bien sûr il existe un moyen de contrer cela en vérifiant que l'url saisie soit la bonne.
Cependant, cette vérification a un coût (selon la page affichée 1 ou 2 requêtes sql avec jointure), et un impact sur la vitesse du site web, celui-ci étant chargé, cela un impact significatif aux heures de pointe.
Il y a donc un impact négatif, pas insurmontable bien sûr, mais il existe.
J'en appelle donc à WRI pour mieux connaitre les impacts négatifs du duplicate content évoqué.
Clairement, ces urls à erreur n'apparaitront que si quelqu'un fait un lien vers le site en introduisant l'erreur. Il faudrait taper manuellement l'url au lieu d'un copié-collé. A mon sens, le cas sera donc suffisamment rare pour ne pas justifier les requêtes sql supplémentaires car le risque de problème causé par le duplicate content sera quasiment nul.
Qu'en pensez vous ?
Merci de vos avis.
Je suis en train de bosser sur la nouvelle ré-écriture des urls d'un de mes sites, et je suis confronté à un problème que j'ai remarqué et qui est présent sur vraiment beaucoup de sites web.
Un exemple valant mieux qu'un long discours, voici le site démo de prestashop :
www.prestashop.com/demo/3-accessoires-ipod
L'url rewriting utilise le premier chiffre, et donc ceci renvoi la même page :
www.prestashop.com/demo/3-accessoires-ipppppppppppppppod
Bien sûr c'est un cas de duplicate content et bien sûr il existe un moyen de contrer cela en vérifiant que l'url saisie soit la bonne.
Cependant, cette vérification a un coût (selon la page affichée 1 ou 2 requêtes sql avec jointure), et un impact sur la vitesse du site web, celui-ci étant chargé, cela un impact significatif aux heures de pointe.
Il y a donc un impact négatif, pas insurmontable bien sûr, mais il existe.
J'en appelle donc à WRI pour mieux connaitre les impacts négatifs du duplicate content évoqué.
Clairement, ces urls à erreur n'apparaitront que si quelqu'un fait un lien vers le site en introduisant l'erreur. Il faudrait taper manuellement l'url au lieu d'un copié-collé. A mon sens, le cas sera donc suffisamment rare pour ne pas justifier les requêtes sql supplémentaires car le risque de problème causé par le duplicate content sera quasiment nul.
Qu'en pensez vous ?
Merci de vos avis.