[Stop] Trop d'indexation, il faut arrêter

Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics

L.Jee
WRInaute accro
WRInaute accro
 
Messages: 7192
Inscription: 11 Déc 2007

[Stop] Trop d'indexation, il faut arrêter

Message le Jeu Juin 03, 2010 5:57

Salut à tous,
Ce matin je souhaitais mettre à jour un site personnel. Je tape donc son adresse dans la barre Firefox, j'oublie le .com et FF me lance une recherche Google. Inutile de préciser que le site sur chacune de ses pages s'est vu infligé dès le lancement un <meta name='robots' content='noindex,nofollow' />. FF me lance donc une recherche via Google et que vois-je en troisième position, mon domaine qui est belle et bien indexé, rendant quelque chose d'invisible aux non initiés visible auprès de tous étant donné que le nom de domaine est un mot générique, GENIAL !

Un petit coup de gueule et aussi pour prévenir d'autres naïfs que Google ne tient compte que de ce qu'il veut...

Bonne journée :mrgreen:


milkiway
WRInaute accro
WRInaute accro
 
Messages: 4910
Inscription: 3 Fév 2004

Re: [Stop] Trop d'indexation, il faut arrêter

Message le Jeu Juin 03, 2010 6:38

Je l'ai aussi indiqué la semaine dernière. Un de mes sites, indexé malgré un disallow + noindex...


UsagiYojimbo
WRInaute accro
WRInaute accro
 
Messages: 8579
Inscription: 23 Nov 2005

Re: [Stop] Trop d'indexation, il faut arrêter

Message le Jeu Juin 03, 2010 8:16

Je reste persuadé que si c'est pour bosser en dev, rien ne vaut un .htaccess (ou un serveur dedié inaccessible hors IP des développeurs).

L.Jee
WRInaute accro
WRInaute accro
 
Messages: 7192
Inscription: 11 Déc 2007

Re: [Stop] Trop d'indexation, il faut arrêter

Message le Jeu Juin 03, 2010 8:46

C'est sûr, mais là n'est pas franchement le sujet :D Je parle bien d'un site en ligne mais non répertorier ou que ce soit en dehors peut-être des bookmarks de certains amis... Je me vois mal mettre un mot de passe pour y accéder c'est anti-fonctionnel...


HawkEye
WRInaute accro
WRInaute accro
 
Messages: 17013
Inscription: 23 Fév 2004

Re: [Stop] Trop d'indexation, il faut arrêter

Message le Jeu Juin 03, 2010 8:51

Préfère peut-être les guillemets aux apostrophes dans la syntaxe de ta balise:

Code: Tout sélectionner
<meta name="robots" content="none" />

L.Jee
WRInaute accro
WRInaute accro
 
Messages: 7192
Inscription: 11 Déc 2007

Re: [Stop] Trop d'indexation, il faut arrêter

Message le Jeu Juin 03, 2010 9:02

C'est la balise ajoutée automatiquement par WP, je vais mettre celle que tu me donnes, ne sait-on jamais... Merci Hawk ;)


Haroeris
WRInaute impliqué
WRInaute impliqué
 
Messages: 601
Inscription: 13 Avr 2010

Re: [Stop] Trop d'indexation, il faut arrêter

Message le Jeu Juin 03, 2010 9:19

Google bafoue régulièrement mon robots.txt également.

mackloug
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 327
Inscription: 23 Aoû 2006

Re: [Stop] Trop d'indexation, il faut arrêter

Message le Ven Juin 04, 2010 9:51

Je remarque aussi que Google ne tient pas compte du robots.txt au moment de l'indexation de la page. Par contre, quelques temps plus tard, il "sort" bien les pages de son index.

On les voit alors apparaître dans les GWT…

J'ai aussi remarqué que parfois je laisse une URL dont j'interdis l'indexation via le robots.txt trainée dans le sitemap. Dans ce cas, il me le signale comme une erreur et semble donné la priorité au sitemap. Mais c'est récent, je n'ai pas le recul pour savoir si d'ici quelques temps elle sera retirée de l'index.


cedric_g
WRInaute accro
WRInaute accro
 
Messages: 3552
Inscription: 18 Jan 2006

Re: [Stop] Trop d'indexation, il faut arrêter

Message le Ven Juin 04, 2010 11:24

À contrario, quand vous passez un site "par accident" en "noindex,nofollow", là il ne vous rate pas...


1-sponsor
WRInaute accro
WRInaute accro
 
Messages: 2603
Inscription: 27 Oct 2006

Re: [Stop] Trop d'indexation, il faut arrêter

Message le Ven Juin 04, 2010 11:57

par ma part
pareille, des dissalow qui ne marche pas... par contre, noindex, nofollow pas de souci, d'ailleurs, ça se désindexe vite une fois que c'est un place...

L.Jee
WRInaute accro
WRInaute accro
 
Messages: 7192
Inscription: 11 Déc 2007

Re: [Stop] Trop d'indexation, il faut arrêter

Message le Ven Juin 04, 2010 12:30

T'as de la chance alors...


HawkEye
WRInaute accro
WRInaute accro
 
Messages: 17013
Inscription: 23 Fév 2004

Re: [Stop] Trop d'indexation, il faut arrêter

Message le Lun Juin 07, 2010 22:57

Haroeris a écrit:Google bafoue régulièrement mon robots.txt également.


Moi il m'indique qu'il détecte 50.000 pages "bloquées par robots.txt".

Ces pages sont effectivement bloquées: parce que malgré le fait qu'elles ne sont linkées de nulle part, Google les a tout de même crawlées, et indexées.

En fait, ces URLs étaient visibles dans le code source sous cette forme:

Code: Tout sélectionner
<a href="{url_a_suivre}" OnClick="javascript:window.open('{url_de_tracking}');">anchor</a>


J'ai modifié ce principe de tracking et me suis mis à un peu d'AJAX...

Code: Tout sélectionner
<a href="{url_a_suivre}" OnClick="javascript: track('{int}');">anchor</a>


...où track(int); est une fonction AJAX en GET, placée dans un fichier externe.

:arrow: eh bien Google va tout de même me crawler plus de 40.000 fois par jour la page track.php?id=int, alors que:

1. celle-ci ne peut être clairement identifiée qu'en exécutant à fond le JS externalisé
2. celle-ci est bloquée par un robots.txt dont le crawl par GoogleBot est antérieur à la mise en service du principe de fonctionnement.

>> Il sait depuis 10 jours qu'il ne doit pas crawler "track.php", mais dès qu'il repère sa présence, il crawl quand même, et de surcroît il renvoie une erreur de type "bloqué par robots.txt".

Gaspillage de ressources (pour eux et pour moi). Pas malin.


1-sponsor
WRInaute accro
WRInaute accro
 
Messages: 2603
Inscription: 27 Oct 2006

Re: [Stop] Trop d'indexation, il faut arrêter

Message le Lun Juin 07, 2010 23:01

Ça fait quelques petits mois qu'il me semble avoir observé que Google interprète maintenant tout le JS ou presque... ou du moins, plus encore qu'on le dit sur les blogs SEO...

Pas cool de crawler quand même maglré les interdictions... :s


milkiway
WRInaute accro
WRInaute accro
 
Messages: 4910
Inscription: 3 Fév 2004

Re: [Stop] Trop d'indexation, il faut arrêter

Message le Mar Juin 08, 2010 7:11

Le moins cool, c'est de voir que la demande de suppression met des plombes! L.Jee, tu as réussi à te faire désindexer ces pages ?

Pour ma part ma version mobile a été indexée par erreur et en plus pile à ce moment là le système a cafouillé... présentant non pas le site mobile mais la version normale. J'ai donc une partie de mon site en DC total.
Suppression demandée mais rien n'y fait.

L.Jee
WRInaute accro
WRInaute accro
 
Messages: 7192
Inscription: 11 Déc 2007

Re: [Stop] Trop d'indexation, il faut arrêter

Message le Mar Juin 08, 2010 14:33

Non tjs indexé ;)

[Stop] Trop d'indexation, il faut arrêter

Si vous avez aimé cette discussion, partagez-la sur vos réseaux sociaux préférés :

Formation recommandée sur ce thème :

Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :

  • Détection de pages dupliquées
    Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages). Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation... Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués.
  • Tester l'indexation récente d'un site dans Google
    Cet outil vous permet de connaître une estimation de l'ancienneté d'un site : il fournit la date à laquelle Google l'a indexé la première fois (et la même chose pour archive.org).
  • Trouver les sous-domaines
    Cet outil vous permet de trouver la liste des sous-domaines (indexés) d'un site.


Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités