Le nouveau contenu n'apparait pas depuis une semaine

Nouveau WRInaute
Bonjour à tous,

J'avais un ancien contenu dans mon site wordpress (une centaine de posts) que j'ai supprimé et remplacé par un nouveau contenu (des milliers de nouveaux posts).

Cela fait une semaine (depuis le 20 fevrier 2015) que j'ai soumis mon fichier robots.txt et un sitemap.xml via Google Webmaster Tools, mais quand je recherche sur Google les pages référencées de mon site, je ne trouve que l'ancien contenu (qui redirige vers une page not found 404 naturellement).

Avant le 20 fevrier 2015, j'avais généré mon sitemap.xml via un code php qui faisait un ping vers Google et Yahoo à chaque génération, donc ave des milliers de nouveaux posts "pingués" à chaque génération, je me suis dis que peut-être Google a vu cela comme du Spam et a du blacklister mon site. Mais comment expliquer dans ce cas, que d'autres pages anciennes de mon site sont toujours référencées ?

Une explication ou solution ?

Merci
 
Membre Honoré
Bonjour,

Vous pouvez faire un test avec l'outil de Google pour savoir si le robot peut indexer vos pages.
Il sera bien de corriger les liens qui ont des erreurs 404 (comme avez indiqué en avoir).

Par contre pas top le :
Code:
To view or apply to this Job, please share this page on social networks

Cordialement.
 
Nouveau WRInaute
Je viens d'essayer de faire un "Fetch as Google" pour un "post" (URL en MP)

Quand je clique sur "submit to index", dans la fenetre qui s'ouvre, le coche l'option "Crawl only this URL", je clique ensuite sur "Go" mais en effet, un message d'erreur apparait sur Google Webmaster tools: An error has occurred. Please try again later.

J'ai essayé la meme manip avec la home page, et j'obtiens le meme message d'erreur. Pourtant cette manip se déroulait sans soucis avec la home page avec le nouveau contenu (pas l'ancien). Donc, je soupçonne un soucis temporaire au niveau de GWM.

Pour:
Code:
To view or apply to this Job, please share this page on social networks

Il s'agit juste d'un effet de brouillage utilisant un "Blur" effect dans le CSS; rien de méchant à priori pour un moteur de recherche.

J'essaierai plus tard de refaire la manip de "submit to index" pour voir.

Si vous avez une autre piste de debuggage, je suis preneur.

Merci
 
Nouveau WRInaute
Je suis allé à la section "robots.txt" puis testé un post (URL en MP) pour voir si "Googlebot" est capable de le lire, C'est le cas "ALLOWED" s'affiche.

Donc, je ne vois vraiment pas pourquoi après 7 jours, ce contenu n'est toujours pas affiché dans Google.
 
Nouveau WRInaute
Dans Google Index --> Index Status: Je vois seulement 182 URLs indexés au 22 Fevrier 2015; c'est loin des milliers d'URLs correspondant à mon nouveau contenu qui etait pourtant soumis à l'indexation le 20 Fevrier 2015.
 
Membre Honoré
Bonjour,

Il semble que l'outil ne fonctionne pas correctement aujourd'hui (testé avec deux sites).
Il faudra vérifier demain s'il fonctionne bien.

Cordialement.
 
WRInaute accro
Donc si je résume...

On a un site sans structure, qui n'offre absolument rien d'autre que de l'information existant sur de nombreux autres sites (Duplicate Content à 100%), sur lequel on balance des milliers de pages d'un coup en espérant que Google va les indexer (et les positionner ???), uniquement via un sitemap XML... le tout en 1 semaine ?

C'est pas pour être méchant, mais sérieux... on est plus en 2002 hein... :roll:
 
Nouveau WRInaute
1. "Un site sans structure": C'est à dire ?

2. Plein de sites ont en vrac un contenu important et pas nécessairement original et aucun soucis pour leur indexation.

Par ailleurs, je viens d'aller dans "Crawl" --> "Crawl Errors", je trouve 8 Soft 404 (URL en MP) L'explication de GWM est la suivante :

The target URL doesn't exist, but your server is not returning a 404 (file not found) error. Learn more

Your server returns a code other than 404 or 410 for a non-existent page (or redirecting users to another page, such as the homepage, instead of returning a 404). This creates a poor experience for searchers and search engines.

Pourtant le lien existe bel et bien sans redirection.
 
Nouveau WRInaute
Peut-etre il vaut mieux ignorer mon message précedent. Je viens de noter la date de cette erreur qui est le 29 Janvier 2015 où les données sur le site n'était pas encore stabilisées. Par contre, pas d'indexation depuis le 20 Fevrier, ce n'est pas normal.
 
Nouveau WRInaute
Madrileño a dit:
Bonjour,

Il semble que l'outil ne fonctionne pas correctement aujourd'hui (testé avec deux sites).
Il faudra vérifier demain s'il fonctionne bien.

Cordialement.

En tout cas, pas de problèmes pour le test avec Googlebot; il est capable de "lire" les liens des nouveaux Posts.
 
WRInaute accro
webforce1 a dit:
1. "Un site sans structure": C'est à dire ?

Il n'y a aucune arborescence, aucune catégorisation de contenu: la seule façon qu'a Google de découvrir ton contenu est de partir de la page d'accueil, et de suivre chacune des 325 paginations...

Tu dois te donner les moyens de segmenter ton contenu, et de l'organiser (par type de job, par région, par ce que tu veux qui soit pertinent, cohérent et pérenne).
 
WRInaute accro
webforce1 a dit:
2. Plein de sites ont en vrac un contenu important et pas nécessairement original et aucun soucis pour leur indexation.

Plein de personnes qui s'appellent "Denis" roulent en Porsche.
Je m'appelle Denis.
Je ne roule pas en Porsche pour autant :)
 
Nouveau WRInaute
HawkEye a dit:
webforce1 a dit:
1. "Un site sans structure": C'est à dire ?

Il n'y a aucune arborescence, aucune catégorisation de contenu: la seule façon qu'a Google de découvrir ton contenu est de partir de la page d'accueil, et de suivre chacune des 325 paginations...

Tu dois te donner les moyens de segmenter ton contenu, et de l'organiser (par type de job, par région, par ce que tu veux qui soit pertinent, cohérent et pérenne).

Mon ancien contenu était dans ce même site, et tous les URLs étaient bien indexés.
 
Nouveau WRInaute
HawkEye a dit:
webforce1 a dit:
2. Plein de sites ont en vrac un contenu important et pas nécessairement original et aucun soucis pour leur indexation.

Plein de personnes qui s'appellent "Denis" roulent en Porsche.
Je m'appelle Denis.
Je ne roule pas en Porsche pour autant :)

Tu confonds "problème d'indexation" qui est l'objet de ce thread et "apparaitre en tete des résultats de recherche". Mon soucis est juste l'absence totale d'indexation de mon nouveau contenu depuis 7 jours maintenant. Avec la commande "Site:" dans la Google, je n'en trouve aucun.
 
WRInaute accro
webforce1 a dit:
Il s'agit juste d'un effet de brouillage utilisant un "Blur" effect dans le CSS; rien de méchant à priori pour un moteur de recherche.
Je parierait pas ma chemise la dessus si un contrôleur qualité passe sur le site :wink: Dans tous les cas qqun comme moi fait demi tour direct et bonjour le signal envoyé aux moteurs ...
Bon après je rejoins Denis la dessus 10000 pages publiées sur une date courte c'est un signal spam évident ou une bonne technique SEO pour plomber cash un domaine au choix.
 
WRInaute accro
webforce1 a dit:
Tu confonds "problème d'indexation" qui est l'objet de ce thread et "apparaitre en tete des résultats de recherche".
Pas forcement, pour la tête de résultat on a compris que c'était chaud d'entré mais pour ce qui est de l'indexation le seul critère que tu peut prendre en compte est GG est il passé ? (cf tes logs) et si, oui, et que tu n'apparaît pas y compris sur la commande site c'est soit attendre soit t'est tricard car il a rejeté les pages.
 
Nouveau WRInaute
Finalement, j'aperçois 3 nouveaux posts sur Google, comme une URL (en MP si besoin) qui a été indexé le 20 Fevrier le jour de la soumission du sitemap.xml. Un autre lien indexé le 19 Fevrier 2015.

Par la suite, plus aucun contenu indexé à part un seul lien (URL en MP) le 26 Fevrier 2015.

Je crois que ce sont les "pings" que j'avais lors des multiples générations de Sitemap qui n'ont pas plu à Google. Pour la dernière génération de sitemap.xml, j'avais bien commenté la partie "ping" dans le PHP. Soit il faut attendre que Google indexe le reste à sa "vitesse" ou bien il doit y avoir une action de ma part pour accélérer le processus d'indexation.

Dans GWT, aucun message indiquant une tentative de Spam dans "search traffic" --> "manual actions"
 
Membre Honoré
Bonjour,

L'indexation est juste plus lente pour le site.
On remarque plusieurs pages indexées depuis le 20 février.

Cordialement.
 
Nouveau WRInaute
Cette lenteur est normale ? Je me rappelle que Google indexait un nouveau contenu posté dans les deux jours qui suivaient sans ping ou soumission de Sitemap.
 
Nouveau WRInaute
Je dirai "de structure" si le site avec l'ancien contenu n'était pas présent; Or j'avais des centaines de posts et tous sans exception étaient indexés par Google.

Par ailleurs, plus d'un Mois après la suppression de cet ancien contenu, Google continue de les lister: https://www.google.com/?gws_rd=ssl#q=site:example.com&start=0 d'autant plus qu'un Sitemap avec le nouveau contenu a été soumis 12 jours plutot.

Tout ça est juste bizzare.
 
WRInaute accro
Mais non ce n'est pas bizzare ;)

Ton contenu sera indexé, in fine.
Mais si la qualité de l'indexation pouvait à elle seule résumer la qualité du positionnement qu'on peut espérer, comprend qu'il y a matière à s'inquiéter :roll:

J'aime les allégories, et elles sont souvent automobiles (on l'a vu plus haut), alors en voici une nouvelle.

Vois ton site comme un réseau routier, avec des métropoles, des villes, des villages, des hameaux, des usines.
Chaque lien est une route (autoroute, nationale, départementale, chemin, sentier).

Si, pour aller du centre de ta plus importante métropole (home page), un automobiliste lambda (Google Bot) ne peut prendre que des petits sentiers... il lui faudra du temps:

- pour découvrir chaque village (nouveaux contenus)
- pour se rendre compte qu'il y'a des routes barrées (404 / contenus supprimés)

Si par contre tu lui permets de prendre l'autoroute jusqu'à la grande ville la plus proche (catégorie, page segment, tête de silo), il la visitera et invitera quelques amis à visiter la région. Chacun de ces amis pourra alors emprunter les nationales environnantes pour découvrir les villages alentours, et les petits hameaux accessibles par les départementales qui en sortent.

Vois ça comme ceci: une page à visiter (crawler), je la représente par un [+]

Ton site:

0 ------------------------------------------------[+]---------

Un site avec une structure logique:

Code:
      ° ---
    o ° ---
      ° ---
      ° ---
    o ° -[+]-
      ° ---
      ° ---
O   o ° ---
      ° ---
      ° ---
    o ° ---
      ° ---
      ° ---
    o ° ---
      ° ---


... maintenant dis-moi laquelle est la plus visible ;)

NB: je ne parle même pas de la possibilité de distribution de potentiel qu'offre un maillage interne bien optimisé sur base de ce type de structure ;)
 
WRInaute accro
webforce1 a dit:
Il s'agit juste d'un effet de brouillage utilisant un "Blur" effect dans le CSS; rien de méchant à priori pour un moteur de recherche.

Je partage l'avis de zeb

zeb a dit:
Je parierait pas ma chemise la dessus si un contrôleur qualité passe sur le site :wink: Dans tous les cas qqun comme moi fait demi tour direct et bonjour le signal envoyé aux moteurs ...
Il ne faut pas oublier que Google a déposé des brevets pour analyser une page sur son apparence, et notamment sur la partie du texte immédiatement visible (au dessus de la ligne de flottaison)

Mais surtout, l'annonce que le contenu non visible sans clic ne serait plus indexé
 
Nouveau WRInaute
Merci; à la limite pour le "share before See", je vais le supprimer dans qlq jours. Peu de candidats vont vouloir partager un Job pour lequel ils veulent postuler et être retenus par la suite.
 
Nouveau WRInaute
Je viens de supprimer l'effet "Share before See"; j'espère que ça va accelérer l'indexation comme cela été le cas auparavant. Pour la "structure" du site, difficle d'aller dans cette piste. Déjà des centaines de sites utilisent le theme présent sur le mien.
 
WRInaute accro
webforce1 a dit:
Je viens de supprimer l'effet "Share before See"; j'espère que ça va accelérer l'indexation comme cela été le cas auparavant.
Je doute que cela influ sur la vitesse de crawl ou de reconnaissance des BL.
webforce1 a dit:
Pour la "structure" du site, difficile d'aller dans cette piste. Déjà des centaines de sites utilisent le thème présent sur le mien.
C'est pas une question que de thème puisque tu as une structure d'indexation en ligne avec page suite comme tous les blogs. Ce qui pourrait être pertinent, sans être trop compliqué, c'est de faire des catégories que tu mettrais en avant au niveau du linking interne.
Pour la petite histoire, j'ai comme toi des contenus abondants avec ce type de structure mais ce qui fait que ça marche c'est que le contenu arrive avec régularité tous les jours a la cadence de deux pages chaque jours. Bref en visitant la tête de rubrique tous les jours, les bots voient facilement les nouvelles pages et n'ont pas besoins de crawler toutes les pages "suites" qui sont de toute façon mal considérées d'entré.
 
Discussions similaires
Haut