Desindexer pour faire le ménage

Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics

piloue
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 6
Inscription: 4 Aoû 2004

Desindexer pour faire le ménage

Message le Lun Nov 14, 2005 16:27

Bonjour,

J'utilise une technologie serveur particulière qui a eu un temps la mauvaise habitude d'afficher dans l'URL un ID de session et qui n'était pas optimisé pour le passage des bots.
Résultat, je peux avoir 20 fois la même page référencée :evil:
On le constate bien pour le site son-et-technique.com sur google où plus de 2200 pages sont référencées alors qu'il ne contient qu'une dizaine de pages statiques et environ 400 références article.

Malheureusement, toutes ces URL sont valides, google n'a aucune raison de les supprimer tout seul.

Depuis l'eau a coulé sous les ponts et on a enfin des choses plus cohérentes en terme de résultat.

C'est à ça que je voudrais arriver pour son-et-technique (et d'autres).

Je le précise tout de suite : je ne peux pas utiliser de htaccess sur ce type de serveur.

La seule solution que je vois c'est mettre des meta de refus de bot
noindex, nofollow dans toutes les pages du site, attendre que les bots passent, suppriment ces pages de leurs index, puis virer mes tags et attendre un nouveau passage.

-> Est-ce le seul moyen de procéder ?
-> Quels sont les risques ?

Merci de vos lumières !


Khal3d
WRInaute impliqué
WRInaute impliqué
 
Messages: 971
Inscription: 3 Déc 2004

Message le Lun Nov 14, 2005 17:04

je compte faire la meme chose pour mon site, mais je sais pas comment procéder ! par meta ou par robots.txt ??? j'ai des tonnes de pages avec le truc PHPSID...


Aquarius
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 447
Inscription: 8 Nov 2004

Message le Lun Nov 14, 2005 17:41

Une autre solution : mettre un robots.txt à la racine de vos sites pour interdire l'indexation de certaines de vos URL par les bots.

Pour déindexer les URL en double qui risquent de provoquer du duplicate content sur Google vous pouvez aller à cette adresse après avoir installer votre robots.txt : http://services.google.com:8882/urlconsole/controller


Khal3d
WRInaute impliqué
WRInaute impliqué
 
Messages: 971
Inscription: 3 Déc 2004

Message le Lun Nov 14, 2005 17:45

Aquarius a écrit:Une autre solution : mettre un robots.txt à la racine de vos sites pour interdire l'indexation de certaines de vos URL par les bots.

Pour déindexer les URL en double qui risquent de provoquer du duplicate content sur Google vous pouvez aller à cette adresse après avoir installer votre robots.txt : http://services.google.com:8882/urlconsole/controller


oui merci, j'ai deja essayer ce formulaire pour le suppression d'un site (en entier), maintenant je veux juste supprimer certaines pages de mon site, ces pages sont générés automatiquement, expl url -http://www.maroc-selection.com/pagechambre.php?hotelid=9976&zoneid=12556 .

que vais je mettre dans le fichier robots .txt ?

piloue
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 6
Inscription: 4 Aoû 2004

Message le Lun Nov 14, 2005 18:59

Quand on se retrouve avec 1000 URL à supprimer, c'est fastidieux...

Par ailleurs, je croyais que le robots.txt était plus pénalisant cas google met un certain temps à voir quand de nouvelles autorisations ont été mises en place.
Ce n'est pas plus facile de se faire re-indexer ensuite si l'on met des méta ?


Khal3d
WRInaute impliqué
WRInaute impliqué
 
Messages: 971
Inscription: 3 Déc 2004

Message le Mar Nov 15, 2005 13:23

j'ai trouver ça sur les pages de google "conseils webmaster":

User-agent: Googlebot
Disallow: /*?

si je met ces lignes dans une fichier robots.txt, google va til vraiment supprimer tout mes pages dynamique ?

merci pour vos réponses


Aquarius
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 447
Inscription: 8 Nov 2004

Message le Mar Nov 15, 2005 15:00

Bin moi j'ai trouvé ça sur le site d'Abondance (à cette adresse : http://docs.abondance.com/robots.html) :

Abondance a écrit: L'étoile (*) n'est acceptée que dans le champ User-agent.
Elle ne peut servir de joker (ou d'opérateur de troncature) comme dans l'exemple : Disallow: /entravaux/*.


Donc ta ligne n'est pas valide...


Aquarius
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 447
Inscription: 8 Nov 2004

Message le Mar Nov 15, 2005 15:06

Khal3d, quelles sont les URL que tu veux supprimer ? Donne un exemple d'URL.

Idem pour Piloue (quel est ton site ?)


HawkEye
WRInaute accro
WRInaute accro
 
Messages: 17013
Inscription: 23 Fév 2004

Message le Mar Nov 15, 2005 15:22

Tu peux aussi utiliser quelquechose comme:

Code: Tout sélectionner
$agent = $_SERVER['HTTP_USER_AGENT'];
if ((stristr($agent, "rchive"))||
// for testing ...
//  (stristr($agent, "your browser"))||
  (stristr($agent, "IE"))||
  (stristr($agent, "bot"))||
  (stristr($agent, "crawl"))||
  (stristr($agent, "index"))||
  (stristr($agent, "eeves"))||
  (stristr($agent, "eck"))||
  (stristr($agent, "link"))||
  (stristr($agent, "cooter"))||
  (stristr($agent, "slurp")
  (stristr($agent, "slurp"))||
  (stristr($agent, "pider")))
  {
    $usesession="no";
  } else {
    include("include/session.php");
    $usesession="yes";
    session_start();
  }


...je te laisse ajouter le poivre, le sel, et passer au four ;)


Khal3d
WRInaute impliqué
WRInaute impliqué
 
Messages: 971
Inscription: 3 Déc 2004

Message le Mar Nov 15, 2005 17:19

Aquarius a écrit:Khal3d, quelles sont les URL que tu veux supprimer ? Donne un exemple d'URL.

Idem pour Piloue (quel est ton site ?)


des pages genre: http://www.maroc-selection.com/pagecham ... neid=12556


Aquarius
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 447
Inscription: 8 Nov 2004

Message le Mar Nov 15, 2005 17:34

Tu met dans ton robots.txt :
Code: Tout sélectionner
User-agent: *
Disallow: /pagechambre.php?


Normalement les bots devraient arréter d'indexer les URL. Après si tu veux vraiment les supprimer de Google, tu vas à l'adresse que je t'ai donné plus haut et tu entres l'URL de ton robots.txt, et Google supprimera les URL correspondantes.


Khal3d
WRInaute impliqué
WRInaute impliqué
 
Messages: 971
Inscription: 3 Déc 2004

Message le Mar Nov 15, 2005 18:31

Aquarius a écrit:Tu met dans ton robots.txt :
Code: Tout sélectionner
User-agent: *
Disallow: /pagechambre.php?


Normalement les bots devraient arréter d'indexer les URL. Après si tu veux vraiment les supprimer de Google, tu vas à l'adresse que je t'ai donné plus haut et tu entres l'URL de ton robots.txt, et Google supprimera les URL correspondantes.

c'est ce que j'ai bien fais :) tnx


Khal3d
WRInaute impliqué
WRInaute impliqué
 
Messages: 971
Inscription: 3 Déc 2004

Message le Mer Nov 16, 2005 10:27

ça marche ;) j'ai utiliser le formulaire super rapide de google pour supprimer toutes mes pages "pagehotel.php?" de mon site ! ce matin la je les trouve plus sur google :)


Aquarius
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 447
Inscription: 8 Nov 2004

Message le Mer Nov 16, 2005 10:31

Content d'avoir pu t'aider mais je pense que tu devrais te tourner sérieusement vers l'URL Rewriting car tes URL sont en général très compliquées, et pour les moteurs c'est pas toujours une bonne chose...


Khal3d
WRInaute impliqué
WRInaute impliqué
 
Messages: 971
Inscription: 3 Déc 2004

Message le Mer Nov 16, 2005 11:16

je compte créer des pages statiques qui vont remplacer celles qui sont dynam, qui seront plus indexé par google, je pense laisser le fichier robots tel qu'il est, ou bien ajoter un meta tag noindex.

Desindexer pour faire le ménage

Si vous avez aimé cette discussion, partagez-la sur vos réseaux sociaux préférés :

Formation recommandée sur ce thème :

Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 1 invité