Epécher le duplicate content après url rewrit
9 messages
• Page 1 sur 1
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
- remédien
- WRInaute discret

- Messages: 148
- Inscription: 4 Avr 2004
Epécher le duplicate content après url rewrit
Salut
J'ai pour habitude, après url rewriting, d'ajouter en tête de fichier un bout de script qui vérifie que l'url est bien celle qu'ele doit être
exemple :
www.blabla.com/partir/avion/billet-avion-paris.php
je fais en sorte que si on a cette url :
www.blabla.com/partir/BATEAU/billet-avion-paris.php
alors o balance un 301 et on retombe sur le bonne page. Ca évite le même contenu sur des infinités d'url possibles (je suis pas parano, mais je me dit que si on veut m'emmerder, suffit de foutre en circulation des url divers et hop les moteurs seront pas content)
Aujourd'hui je termine un site sous spip url rewrité.
Je me demande comment faire cette vérif et ou placer le bout de code adequate.
J4ai fait quelques test, mais je passe pas ...
Une idée ou une expérience ?
Merci
B.
J'ai pour habitude, après url rewriting, d'ajouter en tête de fichier un bout de script qui vérifie que l'url est bien celle qu'ele doit être
exemple :
www.blabla.com/partir/avion/billet-avion-paris.php
je fais en sorte que si on a cette url :
www.blabla.com/partir/BATEAU/billet-avion-paris.php
alors o balance un 301 et on retombe sur le bonne page. Ca évite le même contenu sur des infinités d'url possibles (je suis pas parano, mais je me dit que si on veut m'emmerder, suffit de foutre en circulation des url divers et hop les moteurs seront pas content)
Aujourd'hui je termine un site sous spip url rewrité.
Je me demande comment faire cette vérif et ou placer le bout de code adequate.
J4ai fait quelques test, mais je passe pas ...
Une idée ou une expérience ?
Merci
B.
-

SuperPJ - WRInaute impliqué

- Messages: 513
- Inscription: 15 Jan 2005
Salut, je ne connais pas spip mais un bout de code qui éventuellement pourrait t'être utile est le suivant :
C'est ce que je mets au tout début de mes fichiers rewrités pour générer un 404 s'il y a "?" dans l'url et ainsi éviter que quelqu'un fasse un lien vers la version non rewritée ou, plus subtile, vers la version rewritée mais en ajoutant des paramètres, genre *http://www.monsite.com/page-rewritee.html?abc. La page sera bien affichée au visiteur (donc pas de perte de trafic) mais elle ne sera pas prise en compte par les moteurs (donc pas de duplicate). Maintenant la redirection 301 c'est mieux mais je ne connais pas spip donc je ne pourrai malheureusement pas trop t'aider
- Code: Tout sélectionner
if ( strpos($_SERVER['REQUEST_URI'],'?')!==false )
{
header("HTTP/1.0 404 Not Found");
};
C'est ce que je mets au tout début de mes fichiers rewrités pour générer un 404 s'il y a "?" dans l'url et ainsi éviter que quelqu'un fasse un lien vers la version non rewritée ou, plus subtile, vers la version rewritée mais en ajoutant des paramètres, genre *http://www.monsite.com/page-rewritee.html?abc. La page sera bien affichée au visiteur (donc pas de perte de trafic) mais elle ne sera pas prise en compte par les moteurs (donc pas de duplicate). Maintenant la redirection 301 c'est mieux mais je ne connais pas spip donc je ne pourrai malheureusement pas trop t'aider
- code
- WRInaute impliqué

- Messages: 648
- Inscription: 29 Juil 2005
Justement, je me suis penché sur la question aujourd'hui même suite à l'appel de page rewritées avec un parametre après le html (genre htm?p=xxxx)
j'ai donc redirigé vers une 404 si la page appelée n'est pas la page désirée.
Est-il préférable de rediriger vers la page voulue plutot qu'une 404 ?
j'ai donc redirigé vers une 404 si la page appelée n'est pas la page désirée.
Est-il préférable de rediriger vers la page voulue plutot qu'une 404 ?
- remédien
- WRInaute discret

- Messages: 148
- Inscription: 4 Avr 2004
J'ai toujours redirigé mes sites url rewrités avec un hedaer(location
en cas de mauvaise url. Dans le cas de spip, je viens de faire un script qui passe en force dans les .php3, avant l'include habituel.
Dans ton cas précis, a mon avis l'ajout de variables ne doit pas être préjudiciable ... sinon on en sort plus. Je pense que c'est plutot le chemin d'accès qui peut poser problème ...
B.
en cas de mauvaise url. Dans le cas de spip, je viens de faire un script qui passe en force dans les .php3, avant l'include habituel.
Dans ton cas précis, a mon avis l'ajout de variables ne doit pas être préjudiciable ... sinon on en sort plus. Je pense que c'est plutot le chemin d'accès qui peut poser problème ...
B.
-

Borower - WRInaute passionné

- Messages: 2151
- Inscription: 18 Avr 2005
SuperPJ a écrit:
- Code: Tout sélectionner
if ( strpos($_SERVER['REQUEST_URI'],'?')!==false )
{
header("HTTP/1.0 404 Not Found");
};
Ce sujet m'interresse beaucoup et je n'arrive pas à comprendre comment ce code peut savoir si l'URL est bonne ou pas !
Si quelqu'un veut bien m'expliquer
-

SuperPJ - WRInaute impliqué

- Messages: 513
- Inscription: 15 Jan 2005
Salut Borower
ce code vérifie juste s'il y a le caractère '?' dans l'url demandée (en effet, si la page est rewritée il ne devrait pas y avoir ce caractère). Si c'est le cas, la page s'affiche normalement mais une erreur 404 est envoyée afin d'empêcher son indexation par les moteurs de recherche.
Ce code est à mettre uniquement en header des pages dont on a la certitude qu'elles sont rewritées.
Test de code d'erreur : http://www.webrankinfo.com/english/tool ... header.php
PS : Le code ne certifie pas que la page affichée est la bonne, il empêche juste l'utilisation de paramètres dans l'url.
Ce code est à mettre uniquement en header des pages dont on a la certitude qu'elles sont rewritées.
Test de code d'erreur : http://www.webrankinfo.com/english/tool ... header.php
PS : Le code ne certifie pas que la page affichée est la bonne, il empêche juste l'utilisation de paramètres dans l'url.
- remédien
- WRInaute discret

- Messages: 148
- Inscription: 4 Avr 2004
Bon, pour spip, je suis donc passé en force. J'ai fait un script que je place en tête de chaque php3 avec un include.
J'utilise les fonctions qui génère les url dans spip pour me donner l'url théorique de l'article et je la compare à l'url demandé par le navigateur.
Elles sont identiques : ras, spip poursuit
Elles sont différentes : header(location : url théorique ) + un die (on pourrait mettre un 404 aussi)
C'est surement pas le moins gourmand, mais j'ai horreur de laisser trainer un site sans ce genre de vérif, même si ca n'est que supputations sur l'utilisation maléfique qu'on peut en faire
Et ca evite de voir trainer des url valides de la sorte :
--www.blabla.com/le_webmaster_est_un_gros_con/article152.html
B.
J'utilise les fonctions qui génère les url dans spip pour me donner l'url théorique de l'article et je la compare à l'url demandé par le navigateur.
Elles sont identiques : ras, spip poursuit
Elles sont différentes : header(location : url théorique ) + un die (on pourrait mettre un 404 aussi)
C'est surement pas le moins gourmand, mais j'ai horreur de laisser trainer un site sans ce genre de vérif, même si ca n'est que supputations sur l'utilisation maléfique qu'on peut en faire
Et ca evite de voir trainer des url valides de la sorte :
--www.blabla.com/le_webmaster_est_un_gros_con/article152.html
B.
9 messages
• Page 1 sur 1
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Le Duplicate-Content en question : un cas de duplicate content important non-pénalisé
- Redirection d'une url rewrit vers nouvelle url rewrit
- Sale duplicate content (pas content du tous !!!!!) !!!
- Duplicate content ou pas duplicate
- [help] duplicate content
- Duplicate content possible ?
- duplicate content again
- pb duplicate content
- .FR + .COM = duplicate content
- duplicate content or not duplicate content ?
- Similarité et duplicate content
Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages). Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation... Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités
