id de session et id de panier

Nouveau WRInaute
Bonjour,

en fouillant dans les archives de ce site remarquablement riche, je suis tombé sur la déclaration suivante:
googlebot n'indexe pas les pages sir l'id de session est fournie en paramètre de l'URL

Dans mon cas, j'utilise fishcart, c'est un id de panier (qui permet de suivre le client tout au long de sa visite) qui est fourni dans chaque URL.
Est-ce que googlebot assimile cela à un id de session et bloque donc mon référencement ?
Je ne suis pas expert de php et de la gestion des sessions.

Merci.
 
WRInaute accro
De toute manière Googlebot, normalement, n'ajoutera jamais rien à ton panier. Si tes id de session sont crées après le premier ajout au panier, il n'y a pas de problèmes.
 
WRInaute accro
Je viens de regarder sur le site de ton profil, le cartid est apparement créé lorsqu'on entre dans le catalogue, donc effectivement, là, les pages de ton catalogue ne seront pas indexé à part si tu fait une espèce de petite bidouille qui s'apparente un peu à du cloacking : tu détecte si ton visiteur est un robot, dans ce cas, tu ne génère pas de session. Sinon, tu peut faire ça très proprement en ne créant la session qu'après le premier ajout au panier comme je l'ai dit au dessus.
 
Nouveau WRInaute
Merci beaucoup pour cette expertise.
Impressionnant.
Je m'y attaquerais dès que possible.

Mais je comprend donc que mon cartid est équivalent à un id de session.

Pour quelles raisons techniques Googlebot n'indexe-t-il pas les pages avec une id de session dans l'URL ?[/u]
 
WRInaute accro
Par exemple, prenons 2 pages :
page.php?cartid=aaaaaa
page.php?cartid=bbbbbb

Pour Google, ce sont 2 pages différentes. Donc quand il passe il voit la 1ère page puis la seconde fois qu'il va passer, il va voir une page différente et ainsi de suite. C'est un phénomène bloquant.
 
Nouveau WRInaute
Donc, pour synthétiser, lorsque Googlebot passe plusieurs fois sur la même page, il a des URLs différentes (à cause des paramètres différents).
Il conclue donc à deux pages différentes ayant le même contenu. D'où duplicate, ...

Je comprend pour les id de session (ou équivalent) car ils n'influent pas (ou peu) sur le code html affiché ensuite.

Par contre, qu'en est il des paramètres qui influent sur la composition de la page ?
Autrement dit, comment fait Googlebot pour déterminer si un paramètre influe sur le contenue de la page, auquel cas il explore, ou si c'est un paramètre qui n'influe pas, auquel cas il n'explore pas ?

Aïe aïe aïe, je commence à m'intéresser aux arcanes du référencement... c'est pas comme cela que je vais rattraper le retard monstrueux que j'ai dans tous les dossiers urgents pour avant-hier ... :oops:
 
WRInaute accro
Pour schématisé, on peut dire qu'il passe 2 fois.

Si la 2ème fois qu'il passe, il ne retrouve pas la page qu'il avait trouvé la 1ère fois, il ne l'indexe pas. Donc tous les id de session qu'il s'apelle truc, machin ou sid ou phpSid empêche les pages d'être indexé puisqu'il ne retrouve jamais 2 fois la même page;

Par contre pour les paramètres qui ne sont pas aléatoires, il les retrouvent bien à chaque passage donc il indexe les pages
 
Nouveau WRInaute
Session + Cookie = pas d'id_session au bout des urls mais...

Bonjour,

J'aimerais avoir votre avis sur une problématique

Je vais essayer d'être bref :

> Il s'agit d'un site de e-commerce avec utilisation de sessions (PHP/Mysql)
> Je veux savoir si tel visiteur a bien un ou plusieurs pdts dans son panier
> Je ne veux pas que Google et consor rajoute une id_session aux urls
> Donc je ne déclenche la session que uniquement quand le visiteur clique sur "commander" dans la liste produits, je lui dépose aussi un cookie qui va me dire si ce visiteur à commandé ou non sans avoir à démarrer de session sur chaque page.

> A chaque page je vérifie donc d'abord que le visiteur a le cookie en question et si il en à un je démarre à nouveau une session ( if (isset($_COOKIE["moncookie"])) {session_start();} ), ce qui me permet d'avoir cette info sans déclancher de session pour Googlebot.

Je vérifie ensuite que l'id de session courante correspond à des pdts dans ma base de données, si c'est le cas j'affiche un bouton lien "mon panier" qui donne accès au panier lequel va chercher les pdts en commande de ce visiteur (de cet id_session plus exactement). Vous me suivez j'espère ?

Mon pb : Si le visiteur n'accepte pas les cookies il ne verra jamais le bouton lien "mon panier" et donc ne verra jamais son panier. Si j'enlève le cookie de mon système, Googlebot va tenter d'indexer mes urls avec des id_session au bout et je suis mort.

La question : Alors comment faire pour vérifier que tel visiteur à bien des produits en commande pour pouvoir lui afficher un lien d'accès à son panier sans utiliser les cookies tout en évitant à Google d'ajouter une id_session au bout des urls ?? Ou peut-être que vous voyez une autre possibilité, dans ce cas je suis preneur.

Merci d'avance pour vos idées et bonne continuation ! 8O

Mat
 
WRInaute discret
Re: Session + Cookie = pas d'id_session au bout des urls mai

grainedenet a dit:
Bonjour,

J'aimerais avoir votre avis sur une problématique

Je vais essayer d'être bref :

> Il s'agit d'un site de e-commerce avec utilisation de sessions (PHP/Mysql)
> Je veux savoir si tel visiteur a bien un ou plusieurs pdts dans son panier
> Je ne veux pas que Google et consor rajoute une id_session aux urls
> Donc je ne déclenche la session que uniquement quand le visiteur clique sur "commander" dans la liste produits, je lui dépose aussi un cookie qui va me dire si ce visiteur à commandé ou non sans avoir à démarrer de session sur chaque page.

> A chaque page je vérifie donc d'abord que le visiteur a le cookie en question et si il en à un je démarre à nouveau une session ( if (isset($_COOKIE["moncookie"])) {session_start();} ), ce qui me permet d'avoir cette info sans déclancher de session pour Googlebot.

Je vérifie ensuite que l'id de session courante correspond à des pdts dans ma base de données, si c'est le cas j'affiche un bouton lien "mon panier" qui donne accès au panier lequel va chercher les pdts en commande de ce visiteur (de cet id_session plus exactement). Vous me suivez j'espère ?

Mon pb : Si le visiteur n'accepte pas les cookies il ne verra jamais le bouton lien "mon panier" et donc ne verra jamais son panier. Si j'enlève le cookie de mon système, Googlebot va tenter d'indexer mes urls avec des id_session au bout et je suis mort.

La question : Alors comment faire pour vérifier que tel visiteur à bien des produits en commande pour pouvoir lui afficher un lien d'accès à son panier sans utiliser les cookies tout en évitant à Google d'ajouter une id_session au bout des urls ?? Ou peut-être que vous voyez une autre possibilité, dans ce cas je suis preneur.

Merci d'avance pour vos idées et bonne continuation ! 8O

Mat

Hello,

Bonne question, si quelqu'un à la réponse je suis preneur aussi !
 
WRInaute impliqué
Arrêtez de dire n'importe quoi. Google indexe très bien les pages avec des paramètres et même des paramètres mutiples après le ? (donc id de session, pages non rewritées etc...)

sinon, comment expliquer que des forums type Invision peuvent être très bien placés alors qu'il est difficile de faire de l'url rewriting sur ce forum-là

allez des exemples :

https://www.google.fr/search?hl=fr&q=for ... cher&meta=

4eme et 5eme place : forum non rewrité avec id en parametre

https://www.google.fr/search?hl=fr&q=cas ... cher&meta=

7eme place : Cdisc*unt (un gros site non ?)

Bref, les id et paramètres ne sont absolument pas rédibitoires à un bon référencement.Dis-toi que si tes pages ne sont pas indexées ou sont mal classées à ton goût,il y a certainement d'autres facteurs qui peuvent l'expliquer comme :

- la qualité de tes balises méta (titre, description)
- la qualité de tes backlinks
- la structure de ton site et la qualité des liens internes
- l'ancienneté de ton site
- etc...
L'url, est un des critères, certes, mais pas le seul pour se référencer
 
WRInaute impliqué
Re: Session + Cookie = pas d'id_session au bout des urls mai

grainedenet a dit:
Bonjour,

J'aimerais avoir votre avis sur une problématique

Je vais essayer d'être bref :

> Il s'agit d'un site de e-commerce avec utilisation de sessions (PHP/Mysql)
> Je veux savoir si tel visiteur a bien un ou plusieurs pdts dans son panier
> Je ne veux pas que Google et consor rajoute une id_session aux urls
> Donc je ne déclenche la session que uniquement quand le visiteur clique sur "commander" dans la liste produits, je lui dépose aussi un cookie qui va me dire si ce visiteur à commandé ou non sans avoir à démarrer de session sur chaque page.

> A chaque page je vérifie donc d'abord que le visiteur a le cookie en question et si il en à un je démarre à nouveau une session ( if (isset($_COOKIE["moncookie"])) {session_start();} ), ce qui me permet d'avoir cette info sans déclancher de session pour Googlebot.

Je vérifie ensuite que l'id de session courante correspond à des pdts dans ma base de données, si c'est le cas j'affiche un bouton lien "mon panier" qui donne accès au panier lequel va chercher les pdts en commande de ce visiteur (de cet id_session plus exactement). Vous me suivez j'espère ?

Mon pb : Si le visiteur n'accepte pas les cookies il ne verra jamais le bouton lien "mon panier" et donc ne verra jamais son panier. Si j'enlève le cookie de mon système, Googlebot va tenter d'indexer mes urls avec des id_session au bout et je suis mort.

La question : Alors comment faire pour vérifier que tel visiteur à bien des produits en commande pour pouvoir lui afficher un lien d'accès à son panier sans utiliser les cookies tout en évitant à Google d'ajouter une id_session au bout des urls ?? Ou peut-être que vous voyez une autre possibilité, dans ce cas je suis preneur.

Merci d'avance pour vos idées et bonne continuation ! 8O

Mat

Tu pourrais peut-être essayer de mettre dans ton fichier robots.txt une restriction pour indiquer à Googlebot (et autre bots) que lorsqu'une url contient un paramètre correspondant à un produit dans le panier, il ne doit pas indexer la page

exemple : XXXX.php >> c'est bon
XXXX.php? >> c'est pas bon
 
WRInaute accro
code a dit:
Arrêtez de dire n'importe quoi. Google indexe très bien les pages avec des paramètres et même des paramètres mutiples après le ? (donc id de session, pages non rewritées etc...)

Au passage : mes propos dataient de Septembre 2005. Ce qui est vrai aujourd'hui ne le sera peut-être plus dans 1 an. Voila ce que c'est de remonter des anciens topics...
 
Discussions similaires
Haut