Desindexer pour faire le ménage
16 messages
• Page 1 sur 2 • 1, 2
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
- piloue
- Nouveau WRInaute

- Messages: 6
- Inscription: 4 Aoû 2004
Desindexer pour faire le ménage
Bonjour,
J'utilise une technologie serveur particulière qui a eu un temps la mauvaise habitude d'afficher dans l'URL un ID de session et qui n'était pas optimisé pour le passage des bots.
Résultat, je peux avoir 20 fois la même page référencée
On le constate bien pour le site son-et-technique.com sur google où plus de 2200 pages sont référencées alors qu'il ne contient qu'une dizaine de pages statiques et environ 400 références article.
Malheureusement, toutes ces URL sont valides, google n'a aucune raison de les supprimer tout seul.
Depuis l'eau a coulé sous les ponts et on a enfin des choses plus cohérentes en terme de résultat.
C'est à ça que je voudrais arriver pour son-et-technique (et d'autres).
Je le précise tout de suite : je ne peux pas utiliser de htaccess sur ce type de serveur.
La seule solution que je vois c'est mettre des meta de refus de bot
noindex, nofollow dans toutes les pages du site, attendre que les bots passent, suppriment ces pages de leurs index, puis virer mes tags et attendre un nouveau passage.
-> Est-ce le seul moyen de procéder ?
-> Quels sont les risques ?
Merci de vos lumières !
J'utilise une technologie serveur particulière qui a eu un temps la mauvaise habitude d'afficher dans l'URL un ID de session et qui n'était pas optimisé pour le passage des bots.
Résultat, je peux avoir 20 fois la même page référencée
On le constate bien pour le site son-et-technique.com sur google où plus de 2200 pages sont référencées alors qu'il ne contient qu'une dizaine de pages statiques et environ 400 références article.
Malheureusement, toutes ces URL sont valides, google n'a aucune raison de les supprimer tout seul.
Depuis l'eau a coulé sous les ponts et on a enfin des choses plus cohérentes en terme de résultat.
C'est à ça que je voudrais arriver pour son-et-technique (et d'autres).
Je le précise tout de suite : je ne peux pas utiliser de htaccess sur ce type de serveur.
La seule solution que je vois c'est mettre des meta de refus de bot
noindex, nofollow dans toutes les pages du site, attendre que les bots passent, suppriment ces pages de leurs index, puis virer mes tags et attendre un nouveau passage.
-> Est-ce le seul moyen de procéder ?
-> Quels sont les risques ?
Merci de vos lumières !
-

Aquarius - WRInaute occasionnel

- Messages: 447
- Inscription: 8 Nov 2004
Une autre solution : mettre un robots.txt à la racine de vos sites pour interdire l'indexation de certaines de vos URL par les bots.
Pour déindexer les URL en double qui risquent de provoquer du duplicate content sur Google vous pouvez aller à cette adresse après avoir installer votre robots.txt : http://services.google.com:8882/urlconsole/controller
Pour déindexer les URL en double qui risquent de provoquer du duplicate content sur Google vous pouvez aller à cette adresse après avoir installer votre robots.txt : http://services.google.com:8882/urlconsole/controller
-

Khal3d - WRInaute impliqué

- Messages: 971
- Inscription: 3 Déc 2004
Aquarius a écrit:Une autre solution : mettre un robots.txt à la racine de vos sites pour interdire l'indexation de certaines de vos URL par les bots.
Pour déindexer les URL en double qui risquent de provoquer du duplicate content sur Google vous pouvez aller à cette adresse après avoir installer votre robots.txt : http://services.google.com:8882/urlconsole/controller
oui merci, j'ai deja essayer ce formulaire pour le suppression d'un site (en entier), maintenant je veux juste supprimer certaines pages de mon site, ces pages sont générés automatiquement, expl url -http://www.maroc-selection.com/pagechambre.php?hotelid=9976&zoneid=12556 .
que vais je mettre dans le fichier robots .txt ?
- piloue
- Nouveau WRInaute

- Messages: 6
- Inscription: 4 Aoû 2004
Quand on se retrouve avec 1000 URL à supprimer, c'est fastidieux...
Par ailleurs, je croyais que le robots.txt était plus pénalisant cas google met un certain temps à voir quand de nouvelles autorisations ont été mises en place.
Ce n'est pas plus facile de se faire re-indexer ensuite si l'on met des méta ?
Par ailleurs, je croyais que le robots.txt était plus pénalisant cas google met un certain temps à voir quand de nouvelles autorisations ont été mises en place.
Ce n'est pas plus facile de se faire re-indexer ensuite si l'on met des méta ?
-

Aquarius - WRInaute occasionnel

- Messages: 447
- Inscription: 8 Nov 2004
Bin moi j'ai trouvé ça sur le site d'Abondance (à cette adresse : http://docs.abondance.com/robots.html) :
Donc ta ligne n'est pas valide...
Abondance a écrit: L'étoile (*) n'est acceptée que dans le champ User-agent.
Elle ne peut servir de joker (ou d'opérateur de troncature) comme dans l'exemple : Disallow: /entravaux/*.
Donc ta ligne n'est pas valide...
-

HawkEye - WRInaute accro

- Messages: 17013
- Inscription: 23 Fév 2004
Tu peux aussi utiliser quelquechose comme:
...je te laisse ajouter le poivre, le sel, et passer au four
- Code: Tout sélectionner
$agent = $_SERVER['HTTP_USER_AGENT'];
if ((stristr($agent, "rchive"))||
// for testing ...
// (stristr($agent, "your browser"))||
(stristr($agent, "IE"))||
(stristr($agent, "bot"))||
(stristr($agent, "crawl"))||
(stristr($agent, "index"))||
(stristr($agent, "eeves"))||
(stristr($agent, "eck"))||
(stristr($agent, "link"))||
(stristr($agent, "cooter"))||
(stristr($agent, "slurp")
(stristr($agent, "slurp"))||
(stristr($agent, "pider")))
{
$usesession="no";
} else {
include("include/session.php");
$usesession="yes";
session_start();
}
...je te laisse ajouter le poivre, le sel, et passer au four
-

Khal3d - WRInaute impliqué

- Messages: 971
- Inscription: 3 Déc 2004
Aquarius a écrit:Khal3d, quelles sont les URL que tu veux supprimer ? Donne un exemple d'URL.
Idem pour Piloue (quel est ton site ?)
des pages genre: http://www.maroc-selection.com/pagecham ... neid=12556
-

Aquarius - WRInaute occasionnel

- Messages: 447
- Inscription: 8 Nov 2004
Tu met dans ton robots.txt :
Normalement les bots devraient arréter d'indexer les URL. Après si tu veux vraiment les supprimer de Google, tu vas à l'adresse que je t'ai donné plus haut et tu entres l'URL de ton robots.txt, et Google supprimera les URL correspondantes.
- Code: Tout sélectionner
User-agent: *
Disallow: /pagechambre.php?
Normalement les bots devraient arréter d'indexer les URL. Après si tu veux vraiment les supprimer de Google, tu vas à l'adresse que je t'ai donné plus haut et tu entres l'URL de ton robots.txt, et Google supprimera les URL correspondantes.
-

Khal3d - WRInaute impliqué

- Messages: 971
- Inscription: 3 Déc 2004
Aquarius a écrit:Tu met dans ton robots.txt :
- Code: Tout sélectionner
User-agent: *
Disallow: /pagechambre.php?
Normalement les bots devraient arréter d'indexer les URL. Après si tu veux vraiment les supprimer de Google, tu vas à l'adresse que je t'ai donné plus haut et tu entres l'URL de ton robots.txt, et Google supprimera les URL correspondantes.
c'est ce que j'ai bien fais
16 messages
• Page 1 sur 2 • 1, 2
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Désindexer un répertoire sans désindexer un sous-domaine
- ménage de printemps
- Ménage dans GMAIL
- Faire le ménage sur un site
- Google devrait faire le ménage !!!
- Faire du ménage sur un disque dur
- Faire le ménage dans mes urls
- Combien de temps pour faire le ménage ?
- Google maps et positionnement, pas bon ménage ??
- Affiliation et Duplicate Content = pas bon menage ?!
- Référencement et Web 2.0 - 14-04-2006
- Bonnes pratiques de référencement : sous-domaines ou répertoires ? - 10-12-2007
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 1 invité
