De l'Url rewriting pénalisante?
8 messages • Page 1 sur 1
Consultez la formation URL Rewriting et sites dynamiques de WebRankInfo / Ranking Metrics
- PeterKitsch
- Nouveau WRInaute
- Messages: 22
- Inscription: Lun Avr 14, 2003 6:44
De l'Url rewriting pénalisante?
Bonjour
Et pardonnez moi si la réponse se trouve dans un des forums, j'ai cherché mais n'ai pas trouvé :P
Voilà le binz: J'ai fait de l'url rewriting sur un site, j'avais des types de pages à 1 variable (du type page.php3?parm1=1) et d'autres totalement différents à 2 (du type monautrepage.php3?param2=2¶m3=3) .
Pour les premiers, jai collé de l'extension .html, et j'ai appelé les deuxièmes en .shtml, pourquoi me direz-vous? je javais pas comment les appeller pour qu'elles restent en html et parfois on a envie de tester un peu tout.
Ce n'était pas une très bonne idée, le site était bien placé sur certains mots clés et il a disparu du coup, pourtant si je recherche des keywords sur le site avec google, les pages sont encore indexées.... les anciennes en php3, et le nouvel index en php , les nouvelles en réécriture HTML ont été ignorées.... Le PR est lui à 0 sauf la page d'accueil en php qui est à 5... bref, j'en conclus que j'ai pris une pénalité, mais j'ai du mal à comprendre pourquoi, vu que les anciennes pages n'étaient plus accessibles et traçaient sur l'index en 404 (car j'avais renommé les .php3 rewrités aussi pour éviter les doublons, il y a avait cependant le doublon page.php3/shtml et aussi monautrepage.php3/shtml- est-ce cela qu'il a condamné).
Bref, ce truc m'a l'air bien compliqué, j'ai quand même du mal à cerner ce que google n'a pas aimé... Trop de nouveauté et peut-être... des pages trop optimisées?
Merci de votre aide, si vous le pouvez, j'avoue que je n'y comprends pas grand chose sur ce coup.
Et pardonnez moi si la réponse se trouve dans un des forums, j'ai cherché mais n'ai pas trouvé :P
Voilà le binz: J'ai fait de l'url rewriting sur un site, j'avais des types de pages à 1 variable (du type page.php3?parm1=1) et d'autres totalement différents à 2 (du type monautrepage.php3?param2=2¶m3=3) .
Pour les premiers, jai collé de l'extension .html, et j'ai appelé les deuxièmes en .shtml, pourquoi me direz-vous? je javais pas comment les appeller pour qu'elles restent en html et parfois on a envie de tester un peu tout.
Ce n'était pas une très bonne idée, le site était bien placé sur certains mots clés et il a disparu du coup, pourtant si je recherche des keywords sur le site avec google, les pages sont encore indexées.... les anciennes en php3, et le nouvel index en php , les nouvelles en réécriture HTML ont été ignorées.... Le PR est lui à 0 sauf la page d'accueil en php qui est à 5... bref, j'en conclus que j'ai pris une pénalité, mais j'ai du mal à comprendre pourquoi, vu que les anciennes pages n'étaient plus accessibles et traçaient sur l'index en 404 (car j'avais renommé les .php3 rewrités aussi pour éviter les doublons, il y a avait cependant le doublon page.php3/shtml et aussi monautrepage.php3/shtml- est-ce cela qu'il a condamné).
Bref, ce truc m'a l'air bien compliqué, j'ai quand même du mal à cerner ce que google n'a pas aimé... Trop de nouveauté et peut-être... des pages trop optimisées?
Merci de votre aide, si vous le pouvez, j'avoue que je n'y comprends pas grand chose sur ce coup.
-

mahefarivony - WRInaute accro

- Messages: 11405
- Inscription: Lun Oct 14, 2002 10:00
sans l'adresse de ton site ca va etre difficile, j'ai pas ramené ma boule..
de cristal
de cristal
La migration d'un site vers l'UR est toujours delicate parce qu'on ne peut pas dire du jour au lendemain a Google d'oublier les anciennes url et de les remplacer par les nouvelles... Le seule raison de faire cette migration est a mon sens de remedier a l'inindexabilite des pages avec de nombreux parametres, ce qui manifestement n'est pas ton cas !!!
Il y a une periode pendant laquelle Google connait les 2 url d'une meme page et il n'aime pas ca... Il fait donc un choix (pas celui que tu souhaiterais en general), personnellement je pense que le PR et les BL sont un bons critere pour effectuer ce choix... Il faut donc lui laisser le temps d'integrer la nouvelle topologie de ton site...
Ca c'est la maniere douce... la maniere forte c'est d'utiliser entre autre le fichier robots.txt pour interdire a google d'indexer (ou de les renommer ce qui revient au meme)les anciens fichiers... Mais en general, avec cette methode, les anciennes pages disparaissent beaucoup plus vite que les nouvelles n'apparaissent dans l'index
La perte dans les premiers temps est terrible
et le gain difficile a prouver...
Autant la maniere douce peut passer dans tous les cas, mais la maniere forte n'est a reserver qu'aux pages non indexees et/ou non indexables par Google...
Quand a eu lieu la migration vers l'UR ? Googlebot est-il passe depuis sur les pages ?
Olivier,
PS: J'ai pas compris ton histoire d'extension html vs shtml... Donne ton url pour qu'on fasse une analyse plus poussee
Il y a une periode pendant laquelle Google connait les 2 url d'une meme page et il n'aime pas ca... Il fait donc un choix (pas celui que tu souhaiterais en general), personnellement je pense que le PR et les BL sont un bons critere pour effectuer ce choix... Il faut donc lui laisser le temps d'integrer la nouvelle topologie de ton site...
Ca c'est la maniere douce... la maniere forte c'est d'utiliser entre autre le fichier robots.txt pour interdire a google d'indexer (ou de les renommer ce qui revient au meme)les anciens fichiers... Mais en general, avec cette methode, les anciennes pages disparaissent beaucoup plus vite que les nouvelles n'apparaissent dans l'index
La perte dans les premiers temps est terrible
Autant la maniere douce peut passer dans tous les cas, mais la maniere forte n'est a reserver qu'aux pages non indexees et/ou non indexables par Google...
Quand a eu lieu la migration vers l'UR ? Googlebot est-il passe depuis sur les pages ?
Olivier,
PS: J'ai pas compris ton histoire d'extension html vs shtml... Donne ton url pour qu'on fasse une analyse plus poussee
- PeterKitsch
- Nouveau WRInaute
- Messages: 22
- Inscription: Lun Avr 14, 2003 6:44
En fait il y avait des pages du type:
page.php3?parm1=1 ...
...que j'ai transformées en 1.html par exemple
et d'autres totalement différentes du type:
monautrepage.php3?param2=2&m3=3 ...
.....que j'ai transformées en 2-3.shtml par exemple
(car sinon 2-3.html aurait affiché page.php3?parm1=2-3 ce qui créait des conflits)
Je pense que ton analyse, Olivier, est la bonne, car même sans rewriting, certaines pages d'un autre site qui avaient simplement changé de répertoire tout en restant un peu similaires sont restées ignorées plusieurs mois.
Cette fois la bêtise est que j'ai aussi changé l'index.
Dans l'abslou, mieux vaut faire de l'url rewriting sur un site tout neuf, ou alors pour permettre l'indexation de pages non indexées à + de 2 paramètres... ça me parait plus difficile quand il s'agit d'optimiser encore + des pages déjà bien indexées avec 1 ou 2 variables en php.
Par contre, pour ce qui est des extensions shtml, j'ai à nouveau fait des modifs en jouant sur les extensions .HTM et .HTML pour éviter les conflits décrits + hauts. je pense pas que ce soit le fait de nommer des extensions ssl (shtml) - pour des pages sans ssl justement - qui pose problème ... mais on ne sait jamais.
J'ai remis l'index.html de base à la racine et les urls rewritées dans un nouveau répertoire (certains répertoires sont encore très bien indexés en fait c'est l'index à la racine qui avait (a) disparu après renommage en index.php et rewriting du reste).
On verra ce que ça donne, c'était un test de toute façon... je vous tiens au courant.
page.php3?parm1=1 ...
...que j'ai transformées en 1.html par exemple
et d'autres totalement différentes du type:
monautrepage.php3?param2=2&m3=3 ...
.....que j'ai transformées en 2-3.shtml par exemple
(car sinon 2-3.html aurait affiché page.php3?parm1=2-3 ce qui créait des conflits)
Je pense que ton analyse, Olivier, est la bonne, car même sans rewriting, certaines pages d'un autre site qui avaient simplement changé de répertoire tout en restant un peu similaires sont restées ignorées plusieurs mois.
Cette fois la bêtise est que j'ai aussi changé l'index.
Dans l'abslou, mieux vaut faire de l'url rewriting sur un site tout neuf, ou alors pour permettre l'indexation de pages non indexées à + de 2 paramètres... ça me parait plus difficile quand il s'agit d'optimiser encore + des pages déjà bien indexées avec 1 ou 2 variables en php.
Par contre, pour ce qui est des extensions shtml, j'ai à nouveau fait des modifs en jouant sur les extensions .HTM et .HTML pour éviter les conflits décrits + hauts. je pense pas que ce soit le fait de nommer des extensions ssl (shtml) - pour des pages sans ssl justement - qui pose problème ... mais on ne sait jamais.
J'ai remis l'index.html de base à la racine et les urls rewritées dans un nouveau répertoire (certains répertoires sont encore très bien indexés en fait c'est l'index à la racine qui avait (a) disparu après renommage en index.php et rewriting du reste).
On verra ce que ça donne, c'était un test de toute façon... je vous tiens au courant.
- PeterKitsch
- Nouveau WRInaute
- Messages: 22
- Inscription: Lun Avr 14, 2003 6:44
Qaghan a écrit:
Ca c'est la maniere douce... la maniere forte c'est d'utiliser entre autre le fichier robots.txt pour interdire a google d'indexer (ou de les renommer ce qui revient au meme)les anciens fichiers...
Mais en general, avec cette methode, les anciennes pages disparaissent beaucoup plus vite que les nouvelles n'apparaissent dans l'index :-( La perte dans les premiers temps est terrible :-( et le gain difficile a prouver...
Autant la maniere douce peut passer dans tous les cas, mais la maniere forte n'est a reserver qu'aux pages non indexees et/ou non indexables par Google...
Quand a eu lieu la migration vers l'UR ? Googlebot est-il passe depuis sur les pages ?
>>>>> a titre informatif, aurais-tu la ligne de code adéquate pour le robots.txt dans ce cas? Je ne saurais quoi mettre.
>>>> Migration: fin de semaine dernière (apparemment il y a eu une dance en + ce w-e...)
>>>> Pour googlebot, je ne sais pas, je n'utilise pas ça.... en fait j'avais jamis cherché jusqu'à présent à faire de l'UR, ou utiliser les robots.txt.
PeterKitsch a écrit:>>>>> a titre informatif, aurais-tu la ligne de code adéquate pour le robots.txt dans ce cas? Je ne saurais quoi mettre
Je me suis peut-etre un peu trop avance... je viens de voir que le robots.txt ne permet de specifier que des repertoires...
Je te recommande de consulter la FAQ de WRI a ce sujet : http://www.webrankinfo.com/outils/robots/faq_15_116.htm
>>>> Migration: fin de semaine dernière (apparemment il y a eu une dance en + ce w-e...)
Un peu de patience... Je sais que Google s'amerliore en ce moment mais il ne faut pas etre trop exigeant quand meme... Il y a moins de 6 mois, il fallait compter 1 a 2 mois pour que ce genre de modifications soient prises en compte...
La dance de ce WE est, pour moi, un mystere qu'il reste encore a elucider... Mais quoiqu'il en soit il faut laisser le temps aux robots de Google de parcourir la nouvelle structure de ton site pour mettre a jour son index...
>>>> Pour googlebot, je ne sais pas, je n'utilise pas ça.... en fait j'avais jamis cherché jusqu'à présent à faire de l'UR, ou utiliser les robots.txt.
Googlebot c'est le nom donne aux robots de Google, tu confonds avec googlestat (ou robostat) l'outil developpe par WRI pour recenser le passage des robots sur un site... c'est plus pratique mais il suffit que tu aies acces a tes logs pour etre capable de determiner si les robots de googlebots sont passe sur ton site depuis ta modification... S'ils ne sont pas encore passes, je n'ai rien d'autre a te dire que ... patience. Une fois qu'ils seront passes la mise a jour de l'index est rapide (moins d'une semaine en general)
Olivier,
>>>>> a titre informatif, aurais-tu la ligne de code adéquate pour le robots.txt dans ce cas? Je ne saurais quoi mettre
Je me suis peut-etre un peu trop avance... je viens de voir que le robots.txt ne permet de specifier que des repertoires...
Ah bon, c'est nouveau ça ?
Il me semble que tu peux nommer les fichiers uns à uns. Pour ma part, suite à un url rewriting complet, j'interdit aux robots d'indexer ma page index.php (avec tous les paramètres possibles).
Syntaxe:
User-agent: *
Disallow: index.php
Pour l'instant, ça a l'air de fonctionner même si c'est assez lent,
Loïc.
Et tant qu'a faire, placer un redirect qui renvoie un code HTTP (301 ou 302) des anciennes URL vers les nouvelles.
Ca te permettra de ne pas avoir le pb des 404 pour les internautes qui viennent de Google, et de garder ton positionnement et ton PR.
A Bien'tot.
Ca te permettra de ne pas avoir le pb des 404 pour les internautes qui viennent de Google, et de garder ton positionnement et ton PR.
A Bien'tot.
8 messages • Page 1 sur 1
Formation recommandée sur ce thème :
Formation URL Rewriting et sites dynamiques : apprenez comment mettre en place la réécriture d'URL, comment optimiser vos URL et profiter de vos pages dynamiques pour booster votre référencement. Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Tutoriel URL Rewriting
- Suite de l'article sur le fichier .htaccess : l'URL rewriting
- l'URL Rewriting expliqué aux débutants
- Optimiser le référencement d'un forum phpBB : réécriture d'URL
- 3ème partie de l'article .htaccess : les réécritures conditionnelles
- L'URL Rewriting expliqué aux débutants
- Le référencement de pages PHP
- Guide d'optimisation des redirections pour le référencement
- Design de WRI version 3
- Aperçu des différents types de redirection
- l'url avec tiret est telle pénalisante??
- URL Rewriting : règle de rewriting qui change selon la cat ?
- nettoyer des URL de la base Google apres url rewriting
- Supprimer de google mes anciennes URL (après URL rewriting)
- URL rewriting url avec parametres vers autre url avec param
- après url rewriting, éviter doublon avec url par variable
- délai entre url rewriting et référencement des nouvelles url
- URL-rewriting propre ? ancienne URL 301 mais réel !
- Passer d'un url rewriting à une url non rewritée
- 2 url avec le même url rewriting = problème pour GG ?
- Url rewriting sur url à nombres de mots variables
- url rewriting : url non trouvé via .htacces chez ovh
- Url rewriting pour dotclear avec URL= titre
- url rewriting pr ss-domaine: redirection sans modifier url
- url rewriting avec pourcentage dans l url
- Analyse de popularité
Cet outil vous permet d'analyser en détails la "popularité" de votre site sur Google. En plus du nombre de liens pris en compte par Google, il calcule le pourcentage de liens internes parmi tous les liens, et il affiche les premières URL trouvées. - Transformer des simples citations de votre site en liens
Cet outil vous permet de trouver des pages citant votre site mais ne faisant pas (encore) de lien. Il suffira parfois d'un simple mail pour transformer cette simple citation en lien (backlink).
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités




le forum