Url rewriting et duplicate content : arbitrage des ressources
Règles du forum
Attention ce forum est destiné avant tout à ceux qui découvrent le référencement. Les membres qui auront l'amabilité de répondre à leurs questions sont priés de rester courtois, polis, indulgents, patients et pédagogues... Merci d'avance !
Par ailleurs, inutile d'utiliser ce forum uniquement pour obtenir des liens vers vos sites, les liens sont désactivés pour le référencement (nofollow).
Attention ce forum est destiné avant tout à ceux qui découvrent le référencement. Les membres qui auront l'amabilité de répondre à leurs questions sont priés de rester courtois, polis, indulgents, patients et pédagogues... Merci d'avance !
Par ailleurs, inutile d'utiliser ce forum uniquement pour obtenir des liens vers vos sites, les liens sont désactivés pour le référencement (nofollow).
4 messages
• Page 1 sur 1
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
- maxime!
- WRInaute discret

- Messages: 57
- Inscription: 9 Fév 2005
Url rewriting et duplicate content : arbitrage des ressources
Bonjour,
Je suis en train de bosser sur la nouvelle ré-écriture des urls d'un de mes sites, et je suis confronté à un problème que j'ai remarqué et qui est présent sur vraiment beaucoup de sites web.
Un exemple valant mieux qu'un long discours, voici le site démo de prestashop :
www.prestashop.com/demo/3-accessoires-ipod
L'url rewriting utilise le premier chiffre, et donc ceci renvoi la même page :
www.prestashop.com/demo/3-accessoires-ipppppppppppppppod
Bien sûr c'est un cas de duplicate content et bien sûr il existe un moyen de contrer cela en vérifiant que l'url saisie soit la bonne.
Cependant, cette vérification a un coût (selon la page affichée 1 ou 2 requêtes sql avec jointure), et un impact sur la vitesse du site web, celui-ci étant chargé, cela un impact significatif aux heures de pointe.
Il y a donc un impact négatif, pas insurmontable bien sûr, mais il existe.
J'en appelle donc à WRI pour mieux connaitre les impacts négatifs du duplicate content évoqué.
Clairement, ces urls à erreur n'apparaitront que si quelqu'un fait un lien vers le site en introduisant l'erreur. Il faudrait taper manuellement l'url au lieu d'un copié-collé. A mon sens, le cas sera donc suffisamment rare pour ne pas justifier les requêtes sql supplémentaires car le risque de problème causé par le duplicate content sera quasiment nul.
Qu'en pensez vous ?
Merci de vos avis.
Je suis en train de bosser sur la nouvelle ré-écriture des urls d'un de mes sites, et je suis confronté à un problème que j'ai remarqué et qui est présent sur vraiment beaucoup de sites web.
Un exemple valant mieux qu'un long discours, voici le site démo de prestashop :
www.prestashop.com/demo/3-accessoires-ipod
L'url rewriting utilise le premier chiffre, et donc ceci renvoi la même page :
www.prestashop.com/demo/3-accessoires-ipppppppppppppppod
Bien sûr c'est un cas de duplicate content et bien sûr il existe un moyen de contrer cela en vérifiant que l'url saisie soit la bonne.
Cependant, cette vérification a un coût (selon la page affichée 1 ou 2 requêtes sql avec jointure), et un impact sur la vitesse du site web, celui-ci étant chargé, cela un impact significatif aux heures de pointe.
Il y a donc un impact négatif, pas insurmontable bien sûr, mais il existe.
J'en appelle donc à WRI pour mieux connaitre les impacts négatifs du duplicate content évoqué.
Clairement, ces urls à erreur n'apparaitront que si quelqu'un fait un lien vers le site en introduisant l'erreur. Il faudrait taper manuellement l'url au lieu d'un copié-collé. A mon sens, le cas sera donc suffisamment rare pour ne pas justifier les requêtes sql supplémentaires car le risque de problème causé par le duplicate content sera quasiment nul.
Qu'en pensez vous ?
Merci de vos avis.
- silef
- WRInaute occasionnel

- Messages: 317
- Inscription: 13 Jan 2006
Re: Url rewriting et duplicate content : arbitrage des ressources
J'ai été confronté a ce soucis et il existe une solution intermédiaire qui consiste a ne faire cette vérification avec redirection que pour les bots car après tout ce sont eux qui indexent et doivent avoir la véritable url et pas une douzaine de versions possibles pour la même page.
-

HawkEye - WRInaute accro

- Messages: 17013
- Inscription: 23 Fév 2004
Re: Url rewriting et duplicate content : arbitrage des ressources
maxime! a écrit:Cependant, cette vérification a un coût (selon la page affichée 1 ou 2 requêtes sql avec jointure), et un impact sur la vitesse du site web, celui-ci étant chargé, cela un impact significatif aux heures de pointe.
Crois-tu vraiment qu'une requête sur une clé primaire au format INT() soit si lourde ?
Qui plus est: la requête est la plupart du temps déjà faite... tu dois de toutes façons aller chercher le nom du produit pour l'afficher sur la page... donc un petit passage par ta fonction d'assainissement, une comparaison avec l'URI, et une redirection vers l'URI de contrôle... et le tour est joué
Je fais cette vérification sur mes sites, qu'il s'agisse d'URLs avec une clé numérique, ou de clés sous forme de "slugs": je n'ai pas constaté de ralentissement
4 messages
• Page 1 sur 1
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- duplicate content et url rewriting
- Url rewriting + duplicate content
- URL Rewriting et Duplicate Content
- Duplicate content depuis url rewriting
- URL Rewriting sans duplicate content
- Duplicate content après URL rewriting
- éviter duplicate content après url rewriting
- Duplicate content après activation de URL Rewriting
- forum phpbb : problème url rewriting et duplicate content
- url rewriting sur page d'accueil et duplicate content
- Tutoriel URL Rewriting
- La traduction d'un contenu peut-elle générer une pénalité de duplicate content ?
- Suite de l'article sur le fichier .htaccess : l'URL rewriting
- l'URL Rewriting expliqué aux débutants
- Optimiser le référencement d'un forum phpBB : réécriture d'URL
- La balise d'URL canonique inter-sites
- Comment indiquer une URL canonique dans l'entête HTTP
- Google Webmaster Tools alerte en cas de pb de duplicate content
Consultez la description détaillée des produits ou services de Google suivants : Google goo.gl
- Détection de pages similaires
Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages). Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation... Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 1 invité
