Messages: 12

Enregistré le: 6 Jan 2007

Message le Ven Fév 14, 2014 20:11

Bonjour à tous,
J'ai mis en ligne il y a 3 semaine un site que j'ai fais sur Worldpress 3.8.1.
Le temps de production j’avais mis un robot.txt pour que les moteurs ne viennent pas fouiner, je l’ai viré le jour de sortie.

je l'ai enregistré sur Webmastertool, le sitemap.xml est ok, les pages internes sont en cache dans google mais pas la homepage, je redemande l’examen du sitemap mais rien n’y fait, je ne vois pas de « noindex » dans le code, pas de message d’erreur dans WMT …

Quelqu’un aurais une piste ?

url : http://platinium-limousine.com/

...et merci
Haut
12 Réponses
Messages: 13572

Enregistré le: 5 Déc 2004

Message le Ven Fév 14, 2014 21:04

En, fait elle est indexée on la trouve avec une commande site.

Image
Haut
Messages: 37930

Enregistré le: 7 Juil 2004

Message le Ven Fév 14, 2014 21:23

Bon retour.

Pour votre présentation :
http://forum.webrankinfo.com/les-membres-qui-souhaitent-presentent-t144221.html .

Pareil que Zeb concernant l'indexation de la page.
Vous pouvez utiliser les outils pour webmasters de Google pour vérifier l'indexation de la page et demander au robot de venir indexer la bonne version.

Vous pouvez aussi présenter vos avis en tant qu'utilisateur des sites :
http://forum.webrankinfo.com/avis-sur-vos-sites.html
pour vous aussi aider la communauté d'entraide du forum.

Cordialement.
Haut
Messages: 3259

Enregistré le: 7 Sep 2003

Message le Ven Fév 14, 2014 21:46

avec Worldpress 3.8.1 il n'y a rien d'étonnant

Tu devrais essayer wordpress :mrgreen:
Haut
Messages: 12

Enregistré le: 6 Jan 2007

Message le Sam Fév 15, 2014 10:08

indigene a écrit:avec Worldpress 3.8.1 il n'y a rien d'étonnant

Tu devrais essayer wordpress :mrgreen:


Merci, c'était donc ça ;)
Haut
Messages: 12

Enregistré le: 6 Jan 2007

Message le Sam Fév 15, 2014 10:16

zeb a écrit:En, fait elle est indexée on la trouve avec une commande site.

Image


Oui justement c'est bien ça le problème,
Google reste bloqué sur un fichier robot.txt qui n'est plus là depuis belle lurette.

voici le contenu de mon robot.txt actuel, vous y voyez quelques chose de bloquant pour la homepage?
Code: Tout sélectionner
User-agent: *
Disallow: /wp-admin/
Disallow: /wp-includes/
Disallow: /wp-content/plugins
Disallow: /wp-content/cache
Disallow: /wp-content/themes
Disallow: /category/*/*
Disallow: */trackback
Disallow: */comments
Disallow: /*?
Disallow: /portfolio/
Disallow: /portfolio_tag/
Disallow: /portfolio_category/
Disallow: /wp-content/uploads
Disallow: /feed
Disallow: /comments
Disallow: */trackback
Disallow: */feed
Disallow: */comments
Sitemap: http://platinium-limousine.com/sitemap.xml
Haut
Messages: 13572

Enregistré le: 5 Déc 2004

Message le Dim Fév 16, 2014 0:03

Code: Tout sélectionner
Disallow: /*?

ça je comprend pas ... :( et je trouve que ça sent pas bon.
Haut
Messages: 482

Enregistré le: 9 Avr 2011

Message le Dim Fév 16, 2014 1:04

Pour moi un robots.txt sur wordpress sert surtout à protéger le feed rss.
Code: Tout sélectionner
User-agent: *
Disallow: /wp-admin/
Disallow: /wp-includes/
Disallow: /feed
Disallow: /comments/feed


Tout le reste peut plutôt se faire via .htaccess (cacher les arborescences de fichiers) et balise <meta name="robots" content="noindex,follow"/> pour les pages.

Le plugin SEO de yoast permet facilement d'ajouter cette balise sur les types de pages que l'on souhaite (ou au cas pas cas).
Haut
Messages: 12

Enregistré le: 6 Jan 2007

Message le Dim Fév 16, 2014 20:55

Merci a tous,
La home est en cache,
Il semble que Google c'était concentré sur les pages internes lors de son dernier passage, il est repassé et à indexé la page sans que ne modifie rien de spécial.

Merci pour vos réponses
Haut
Messages: 18372

Enregistré le: 5 Juin 2006

Message le Dim Fév 16, 2014 22:18

zeb a écrit:
Code: Tout sélectionner
Disallow: /*?

ça je comprend pas ... :( et je trouve que ça sent pas bon.


Mais si c'est très bien. Sur un site WordPress réécrit il n'y a pas de page avec ? donc il faut bien les interdire au crawl (ce sont les pages avec l'url sans réécriture)
Haut
Messages: 12290

Enregistré le: 23 Nov 2005

Message le Dim Fév 16, 2014 22:29

Si tu affiches ton robots.txt via GWT, il est normal ? Parce qu'il y a un cache du robots.txt au niveau de leurs outils, et ça peut mettre quelques jours, si le site à été crawlé avec un robots.txt en noindex, pour que le cache soit mis à jour.
Haut
Messages: 13572

Enregistré le: 5 Déc 2004

Message le Lun Fév 17, 2014 22:38

Marie-Aude a écrit:(ce sont les pages avec l'url sans réécriture)

C'est ce que je me suis dit (en mode regex) mais j'ai pas compris pourquoi (effectivement inutile pour un site réécrit) et du coup je me suis demandé si un bot mal foutu pourrait ne pas ignorer tout simple le "?" et du coup faire sauter l'index.
Après 2mn de cogitum, je me suis dit aussi que si tel était le cas c'est tout le site qui ne serait pas indexé (/*) et j'ai posté quand même car dans le fond c'était soit inutile soit pénalisant.
Haut
Messages: 12

Enregistré le: 6 Jan 2007

Message le Mer Fév 19, 2014 21:45

Merci,
je pense comme vous que le cache du robot ai sont propre timing de mise a jour.
Merci pour votre aide.
:wink:
Haut