[Stop] Trop d'indexation, il faut arrêter
27 messages
• Page 1 sur 2 • 1, 2
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
- L.Jee
- WRInaute accro

- Messages: 7192
- Inscription: 11 Déc 2007
[Stop] Trop d'indexation, il faut arrêter
Salut à tous,
Ce matin je souhaitais mettre à jour un site personnel. Je tape donc son adresse dans la barre Firefox, j'oublie le .com et FF me lance une recherche Google. Inutile de préciser que le site sur chacune de ses pages s'est vu infligé dès le lancement un <meta name='robots' content='noindex,nofollow' />. FF me lance donc une recherche via Google et que vois-je en troisième position, mon domaine qui est belle et bien indexé, rendant quelque chose d'invisible aux non initiés visible auprès de tous étant donné que le nom de domaine est un mot générique, GENIAL !
Un petit coup de gueule et aussi pour prévenir d'autres naïfs que Google ne tient compte que de ce qu'il veut...
Bonne journée
Ce matin je souhaitais mettre à jour un site personnel. Je tape donc son adresse dans la barre Firefox, j'oublie le .com et FF me lance une recherche Google. Inutile de préciser que le site sur chacune de ses pages s'est vu infligé dès le lancement un <meta name='robots' content='noindex,nofollow' />. FF me lance donc une recherche via Google et que vois-je en troisième position, mon domaine qui est belle et bien indexé, rendant quelque chose d'invisible aux non initiés visible auprès de tous étant donné que le nom de domaine est un mot générique, GENIAL !
Un petit coup de gueule et aussi pour prévenir d'autres naïfs que Google ne tient compte que de ce qu'il veut...
Bonne journée
-

UsagiYojimbo - WRInaute accro

- Messages: 8579
- Inscription: 23 Nov 2005
Re: [Stop] Trop d'indexation, il faut arrêter
Je reste persuadé que si c'est pour bosser en dev, rien ne vaut un .htaccess (ou un serveur dedié inaccessible hors IP des développeurs).
- L.Jee
- WRInaute accro

- Messages: 7192
- Inscription: 11 Déc 2007
Re: [Stop] Trop d'indexation, il faut arrêter
C'est sûr, mais là n'est pas franchement le sujet
Je parle bien d'un site en ligne mais non répertorier ou que ce soit en dehors peut-être des bookmarks de certains amis... Je me vois mal mettre un mot de passe pour y accéder c'est anti-fonctionnel...
-

HawkEye - WRInaute accro

- Messages: 17013
- Inscription: 23 Fév 2004
Re: [Stop] Trop d'indexation, il faut arrêter
Préfère peut-être les guillemets aux apostrophes dans la syntaxe de ta balise:
- Code: Tout sélectionner
<meta name="robots" content="none" />
- mackloug
- WRInaute occasionnel

- Messages: 327
- Inscription: 23 Aoû 2006
Re: [Stop] Trop d'indexation, il faut arrêter
Je remarque aussi que Google ne tient pas compte du robots.txt au moment de l'indexation de la page. Par contre, quelques temps plus tard, il "sort" bien les pages de son index.
On les voit alors apparaître dans les GWT…
J'ai aussi remarqué que parfois je laisse une URL dont j'interdis l'indexation via le robots.txt trainée dans le sitemap. Dans ce cas, il me le signale comme une erreur et semble donné la priorité au sitemap. Mais c'est récent, je n'ai pas le recul pour savoir si d'ici quelques temps elle sera retirée de l'index.
On les voit alors apparaître dans les GWT…
J'ai aussi remarqué que parfois je laisse une URL dont j'interdis l'indexation via le robots.txt trainée dans le sitemap. Dans ce cas, il me le signale comme une erreur et semble donné la priorité au sitemap. Mais c'est récent, je n'ai pas le recul pour savoir si d'ici quelques temps elle sera retirée de l'index.
-

HawkEye - WRInaute accro

- Messages: 17013
- Inscription: 23 Fév 2004
Re: [Stop] Trop d'indexation, il faut arrêter
Haroeris a écrit:Google bafoue régulièrement mon robots.txt également.
Moi il m'indique qu'il détecte 50.000 pages "bloquées par robots.txt".
Ces pages sont effectivement bloquées: parce que malgré le fait qu'elles ne sont linkées de nulle part, Google les a tout de même crawlées, et indexées.
En fait, ces URLs étaient visibles dans le code source sous cette forme:
- Code: Tout sélectionner
<a href="{url_a_suivre}" OnClick="javascript:window.open('{url_de_tracking}');">anchor</a>
J'ai modifié ce principe de tracking et me suis mis à un peu d'AJAX...
- Code: Tout sélectionner
<a href="{url_a_suivre}" OnClick="javascript: track('{int}');">anchor</a>
...où track(int); est une fonction AJAX en GET, placée dans un fichier externe.
1. celle-ci ne peut être clairement identifiée qu'en exécutant à fond le JS externalisé
2. celle-ci est bloquée par un robots.txt dont le crawl par GoogleBot est antérieur à la mise en service du principe de fonctionnement.
>> Il sait depuis 10 jours qu'il ne doit pas crawler "track.php", mais dès qu'il repère sa présence, il crawl quand même, et de surcroît il renvoie une erreur de type "bloqué par robots.txt".
Gaspillage de ressources (pour eux et pour moi). Pas malin.
-

1-sponsor - WRInaute accro

- Messages: 2603
- Inscription: 27 Oct 2006
Re: [Stop] Trop d'indexation, il faut arrêter
Ça fait quelques petits mois qu'il me semble avoir observé que Google interprète maintenant tout le JS ou presque... ou du moins, plus encore qu'on le dit sur les blogs SEO...
Pas cool de crawler quand même maglré les interdictions... :s
Pas cool de crawler quand même maglré les interdictions... :s
-

milkiway - WRInaute accro

- Messages: 4910
- Inscription: 3 Fév 2004
Re: [Stop] Trop d'indexation, il faut arrêter
Le moins cool, c'est de voir que la demande de suppression met des plombes! L.Jee, tu as réussi à te faire désindexer ces pages ?
Pour ma part ma version mobile a été indexée par erreur et en plus pile à ce moment là le système a cafouillé... présentant non pas le site mobile mais la version normale. J'ai donc une partie de mon site en DC total.
Suppression demandée mais rien n'y fait.
Pour ma part ma version mobile a été indexée par erreur et en plus pile à ce moment là le système a cafouillé... présentant non pas le site mobile mais la version normale. J'ai donc une partie de mon site en DC total.
Suppression demandée mais rien n'y fait.
27 messages
• Page 1 sur 2 • 1, 2
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Pourquoi GG stop sont indexation !!!!???
- Indexation google compromise si trop de sous dossiers ?
- Trop d'impots, trop de taxes, trop de cotisations : partir à l'étranger ?
- Arreter sa microentreprise
- backlink sandbox continuer ou arreter ?
- Duplicate content, comment arreter le massacre
- Arrêter adwords si le référencement naturel est meilleur
- arrêter l'indexation des résultat de moteur de recherche
- comt arreter prelevement automatique de ma carte sur adword?
- apres adword , faut t'il arreter une fois le référencement naturel est meilleur !!
- Tout pour indexer vos contenus dans Google - 17-02-2009
- Etude de Googlebot, le robot d'indexation de Google - 30-07-2002
- Outil de test d'indexation Google + analyse de l'âge d'un site - 15-02-2008
- Etude de Googlebot, le robot crawler de Google (Fresh Bot, Deep Bot) - 05-09-2008
- Optimiser le nombre de mots dans les textes de liens - 03-10-2005
- Mise à jour de Google Images (16/04/2006) - 18-04-2006
- Du nouveau dans le Centre pour Webmasters de Live Search - 07-08-2008
- la Google Dance de novembre a commencé ! - 28-11-2002
- Détection de pages dupliquées
Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages). Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation... Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués. - Tester l'indexation récente d'un site dans Google
Cet outil vous permet de connaître une estimation de l'ancienneté d'un site : il fournit la date à laquelle Google l'a indexé la première fois (et la même chose pour archive.org). - Trouver les sous-domaines
Cet outil vous permet de trouver la liste des sous-domaines (indexés) d'un site.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités


