indexation de pages avec une url page.aspx?id=valeur

  • Auteur de la discussion adabey
  • Date de début
A
adabey
Guest
Bonjour,

des amis qui ont un site http://www.dvdcritiques.com/

ont des pages du type page.aspx?id=valeur :
exemple : http://www.dvdcritiques.com/critiques/dvd_visu.aspx?id=875
et ils ont beaucoup de mal à les indexer chez Google.

J´ai lu quelque part dans un forum que les paramètres des url dynamiques nommés "id" posaient problème car associés à des ouvertures de session.

Comme d´autres pages sans paramètre ont été indexées (en aspx et sans paramètre) je suppose que le problème provient du nom du paramètre.

Si quelqu´un peut aporter quelques argument à ces hypothèses.
En attendant, ils vont changer le nom id en autre chose pour voir si GG fait bel et bien une allergie aux ids.

Merçi d´avance.
 
WRInaute occasionnel
J'avais quelques pages qui trainaient sur un ancien site avec des pages du genre actu.asp?id=XXX
Google ne les indexaient pas (il ne les crawl meme pas), et depuis que ces pages ont été changées en actu.asp?news=XXX (actu.asp?newsid=XXX est OK aussi, testé sur un autre site) Google les a dévorées en qq jours et indexées. Donc oui a priori les deux paramètres à proscrire sont "id" et "sid".

Le principal argument pour ne pas indexer les pages contenant le paramètre id ou sid : puisqu'il s'agit la plupart du temps d'un identifiant de session, Google indexerait X fois la meme page. Gachis de temps, de bande passante, des pages a filtrer dans l'index parce que duplicate content, en voila assez je pense :)

Fred
 
WRInaute occasionnel
Et si tu veux un cas un peu plus concret sur ce qui pourrait arriver si Google indexait ce genre de pages : Il y a quelques années pour remédier aux pb des proxies peu respectueux (ils ne respectaient pas le "expire" et conservaient les pages en cache), j'avais créé des pages genre

page.asp?anticache=<%=Date et heure%>

Le problème : google pensaient trouver une nouvelle page a chaque visite ! Donc au bout de 2 ans, pour récupérer une seule et meme page il passait environ une centaine de fois genre :

page.asp?anticache=13/10/2001:12:32:00
page.asp?anticache=02/06/2002:16:21:45
etc...

Tout ca pour une seule page, qui était finalement indexée une seule fois dans l'index (les autres étaient présentes mais il éliminait le cache). Meme si l'utilisation de cette méthode n'était pas dans un but de spamdexing, google ne peut pas le savoir, mais pour autant n'a jamais pénalisé cette page pour duplicate content a priori.

Fred
 
WRInaute discret
Salut adabey,

Je te confirme que GG ne prend pas en compte "id="

Je viens de modifier les scripts de mes pages PHP pour non plus "id=" mais "val=", et là aucun problème il les a repérées tout de suite...

Sinon, si ton hébergeur accepte l'Url Rewriting... celà peut etre la solution au problème.
 
A
adabey
Guest
BZHcool a dit:
Salut adabey,

Je te confirme que GG ne prend pas en compte "id="

Je viens de modifier les scripts de mes pages PHP pour non plus "id=" mais "val=", et là aucun problème il les a repérées tout de suite...

Sinon, si ton hébergeur accepte l'Url Rewriting... celà peut etre la solution au problème.

Ok !

Je crois que le changement de nom sera fait !
Pour l'url_rewriting je leur soumet la suggestion. C'est vrai que ça simplifie
l'affaire.

Merçi de ces réponses précises.
 
WRInaute discret
Salut petit ours,

Regarde bien... ce n'est pas id= mais content_id=xxx

Et c'est bien là, la différence... Car effectivement tu peux aussi trouver cat_id= ou bien d'autres mais dans ce cas id est rattaché a autre chose.... donc GG suit pas l'Url.
 
Discussions similaires
Haut