Désactiver des urls créées dynamiquement
11 messages • Page 1 sur 1
Consultez la formation URL Rewriting et sites dynamiques de WebRankInfo / Ranking Metrics
Désactiver des urls créées dynamiquement
salut,
j'ai passé un des mes sites à l'urlrewriting, j'ai maitenant des urls du style :
--http://www.monsiteamoi.com/Annuaire_broken_xxx.html
(avec xxx = nombre)
Je voudrais désactiver (qu'elle soient ignorées par google) ces urls car c'est la meme page derriere et google risque de prendre ça comme des "doubles"
est-ce quil possible de faire ça ?
merci
a+nico
j'ai passé un des mes sites à l'urlrewriting, j'ai maitenant des urls du style :
--http://www.monsiteamoi.com/Annuaire_broken_xxx.html
(avec xxx = nombre)
Je voudrais désactiver (qu'elle soient ignorées par google) ces urls car c'est la meme page derriere et google risque de prendre ça comme des "doubles"
est-ce quil possible de faire ça ?
merci
a+nico
Tu voudrais en fait que google n'indexe plus tes .php mais uniquement tes .html, c'est ça ?
Si je prends l'exemple de mon forum phpBB, les anciennes adresse php sont toujours valides et donc j'ai toujours 2 adresses qui pointent vers une même page (.php et celle en .html avec url rewriting). Je ne crois pas que ce soit trés grave en fait.
Par contre, peut être qu'un
dans le robots.txt permettrait ça. Mais dans ce cas, si google demande mapage_50.html (qui est rewrité en mapage.php?x=50) cela fonctionnera-t-il ? je pense que oui, car le robots.txt dit juste à google de ne pas prendre les fichiers *.php, mais il demandera les .html (il ne sait pas a priori que ces url sont rewritées). Ensuite, ben c'est le serveur apache qui traduira ces .html en .php.
Donc je pense que cette ligne dans ton robots.txt résoud ton pb (mais attention, il faut que tu ais fait de l'url rewriting sur TOUTES les pages php.
Si je prends l'exemple de mon forum phpBB, les anciennes adresse php sont toujours valides et donc j'ai toujours 2 adresses qui pointent vers une même page (.php et celle en .html avec url rewriting). Je ne crois pas que ce soit trés grave en fait.
Par contre, peut être qu'un
- Code: Tout sélectionner
Disallow: /repertoire_cible/*.php
dans le robots.txt permettrait ça. Mais dans ce cas, si google demande mapage_50.html (qui est rewrité en mapage.php?x=50) cela fonctionnera-t-il ? je pense que oui, car le robots.txt dit juste à google de ne pas prendre les fichiers *.php, mais il demandera les .html (il ne sait pas a priori que ces url sont rewritées). Ensuite, ben c'est le serveur apache qui traduira ces .html en .php.
Donc je pense que cette ligne dans ton robots.txt résoud ton pb (mais attention, il faut que tu ais fait de l'url rewriting sur TOUTES les pages php.
Bgest, merci
non, Je voudrais que google n'indexe plus les sites --www.monsite.com/Annuaire_broken_xxx.html
avec xxx representant un nombre entre 1 et 999999
sinon j'ai des .php et .html donc je peux pas faire comme tu dis...
a+nico
non, Je voudrais que google n'indexe plus les sites --www.monsite.com/Annuaire_broken_xxx.html
avec xxx representant un nombre entre 1 et 999999
sinon j'ai des .php et .html donc je peux pas faire comme tu dis...
a+nico
Bon ben mon *.php ne peut pas fonctionner de toute façon, je viens de trouver ça sur le fichier robots.txt :
Je vais donc mettre tous les fichiers .php du forum phpBB en disallow (un peu comme ce qui est fait sur le site WRI). Enfin, sauf le index.php bien sur
L'étoile (*) n'est acceptée que dans le champ User-agent.
Elle ne peut servir de joker (ou d'opérateur de troncature) comme dans l'exemple : Disallow: /entravaux/*.
Je vais donc mettre tous les fichiers .php du forum phpBB en disallow (un peu comme ce qui est fait sur le site WRI). Enfin, sauf le index.php bien sur
Je ne suis pas un pro de l'url rewrtiing, mais d'après ce que j'en comprends, la page en .html est virtuelle, seule la page en .php a du contenu conprehensible par google et les autres.
Si vous supprimez la page en .php, qu'est ce que liront les moteurs et les visiteurs.
D'ailleurs sur qu'elles pages faites vous les modifications quand un faute d'ortographe est à corriger, sur les .html ou les .php
Si vous supprimez la page en .php, qu'est ce que liront les moteurs et les visiteurs.
D'ailleurs sur qu'elles pages faites vous les modifications quand un faute d'ortographe est à corriger, sur les .html ou les .php
Kmacleod a écrit:Je ne suis pas un pro de l'url rewrtiing, mais d'après ce que j'en comprends, la page en .html est virtuelle, seule la page en .php a du contenu conprehensible par google et les autres.
C'est pas vraiment ca .. Google ne voit que le lien html.
La requete sur le lien Html est convertie au niveau du serveur en page php lui correspondant.
Si on a une page php avec 1, 2 variables ou plus encodées URL, la technique consiste a appeler l'exécution de ce script php a partir d'une adresse html en récurpéant les variables dans la chaine de l'url HTML.
Pour cela, il faut utiliser le mode rewrite Apache. Ensuite, il y a plusieurs facon d'arriver au meme résultat.
Soit on utilise les fonctionalités avancées du module rewrite avec les expressions UNIX et on récupre automatiqement les variables utiles dans PHP.
Soit ,on se contente de la redirection sur le script php des uRL HTML et on traite la chaine de caractères de l'adresse html pour récupèrer en début de script les variables qui la carctérisent.
Après avoir modifié mon URL rewriting 4 ou 5 fois en moins d'un mois, je me suis aperçu que dans certains moteurs (AlltheWeb), certaines de mes pages figuraient en plusieurs exemplaires puisqu'accessibles par plusieurs URL successives.
Ce que je fais, à la fois pour éviter les contenus en double dans les moteurs, et surtout pour éviter que mes visiteurs rencontrent plein de pages 404, c'est :
(le code doit être placé dans le fichier .htaccess)
Le mot-clé permanent peut être remplacé par temp, ça dépend ce que vous voulez faire.
Résultat : ça marche très bien, j'ai en ce moment un fort pourcentage de codes 301 et 302 pour les requêtes sur mon site, mais aucune erreur 404
Ce que je fais, à la fois pour éviter les contenus en double dans les moteurs, et surtout pour éviter que mes visiteurs rencontrent plein de pages 404, c'est :
- Code: Tout sélectionner
Redirect permanent /ancienne_page http://monsiteamoi/nouvelle_page
(le code doit être placé dans le fichier .htaccess)
Le mot-clé permanent peut être remplacé par temp, ça dépend ce que vous voulez faire.
Résultat : ça marche très bien, j'ai en ce moment un fort pourcentage de codes 301 et 302 pour les requêtes sur mon site, mais aucune erreur 404
11 messages • Page 1 sur 1
Formation recommandée sur ce thème :
Formation URL Rewriting et sites dynamiques : apprenez comment mettre en place la réécriture d'URL, comment optimiser vos URL et profiter de vos pages dynamiques pour booster votre référencement. Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Google n'indexe pas les URL qui se terminent par .0 ?
- URL canonique : plugins pour Wordpress, Drupal, Joomla et Magento
- Nouvelles fonctionnalités à l'essai pour la Google Toolbar
- Voici comment désactiver les suggestions Google (Google Suggest)
- Réflexions sur le fameux rel=nofollow
- Où placer son fichier Sitemap ? A la racine ?
- Chercher des fichiers KML dans Google Earth
- Microsoft désactive les opérateurs link: et linkdomain:
- Contraintes d'emplacement du Sitemap
- Référencement : le problème des sessions des pages PHP
- Désactiver les sessions dans les URLS ?
- Référencement de pages créées avec un wiki
- AJAX=Listes déroulantes créées/rechargées, récupérer valeurs
- Gestion de robots.txt des pages créées en htaccess
- Pages satellites créées par une agence : que faire ?
- Découper une image dynamiquement
- Mots clés générés dynamiquement
- changer dynamiquement la couleur des annonces : efficace ?
- Créer dynamiquement des critères personnalisés
- Générer des meta tag dynamiquement
- Mettre en forme un fichier XML récupéré dynamiquement
- Google remplace dynamiquement le titre des pages
- gerer les metas titres dynamiquement
- Modifier dynamiquement les couleurs d'adsense? Ancien code?
- Serveur dédié, OVH, Création sous-domaine dynamiquement
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités





le forum