Google News - faire reconnaître à Google l'article

WRInaute accro
Bonjour,

je suis confronté a pas mal de problème avec google news qui ignore pas mal d'articles pour causes "article fragmenté" ou "article trop long" sans forcement que cela soit juste. il a donc des soucis a bien reconnaitre le début et la fin d'article, et je me demande comment l'aider plus dans son crawl.

en exemple :

articles fragmentés :
http://www.ladepeche.fr/article/2008/06 ... sonne.html
http://www.ladepeche.fr/article/2008/06 ... rogue.html

articles trop long :
http://www.ladepeche.fr/article/2008/06 ... pagne.html
http://www.ladepeche.fr/article/2008/06 ... istes.html
alors qu'ils ne me semblent pas si long que ça..


avez-vous des idées / avis / remède pour ça ?

merci
 
WRInaute accro
précisions : sur ces derniers 15 jours, il m'en a refusé 1145, un peu angoissant car ça fait une moyenne de 76 par jour.

personne n'a été confronté à ce problème ?
 
WRInaute passionné
C'est récent (je veux dire, avant ca fonctionnait) ?

T'a vérifié dans les guidelines si ils n'avaient pas changé quelque chose dans leur algo d'indexation ?
 
WRInaute impliqué
J'ai eu aussi ces problèmes mais dans une moindre mesure
Pour le morcellement, je pense qu'il regarde la balise p, il faut en mettre le moins possible dans un article. Perso, je l'ai remplacée par un double br le plus possible.

Autre piste (qui n'exclut pas la précédente), il ne voit pas toujours le rapport entre les différents paragraphes. D'où nécessité d'étre cohérent dans le déroulement de l'article avec à chaque fois un ou 2 mots directement en relation avec le paragraphe précédent.
J'ai par exemple souvent des problèmes avec ce type d'article (mais je ne changerai pas pour lui ) où 3 paragraphes non rien à voir entre eux
http://www.ctendance.com/article-12479.html


Pour les articles trop longs, c'est un peu plus compliqué. Il est incohérent au même titre que les articles trop courts. Personne n'est parfait, même pas gg, il a encore bien du mal à gérer les contenus.
sur Actu, on voit encore des faits divers dans la rubrique Culture, c'est dire...
 
WRInaute accro
et comment tu gère ton ensemble "titre - texte - photo - liens divers (imprimer - envoyer à un ami, dans la meme thématique, ...)

il faudrait par exemple faire un bloc (div?) qui contiendrai titre, depuis apres photo / texte (avec le moins de code html entre) et sortir de ce div les liens divers ?
 
WRInaute impliqué
Le site du lien que je t'ai donné fonctionne avec Spip ( pour ceux qui connaissent)
GG Actu sait très bien trouver ton article, pas besoin de mettre un ruban rouge autour.
D'une manière générale je pense qu'il est préférable que ton article doit se trouver le plus haut possible dans ton code source. Quand il aura bien identifié son emplacement, il saura éliminer tout ce qu'il y a autour et même les pubs récurrentes ou autre chose habituelle qui se trouve dedans.
Pour lui, je crois que l'article commence au titre et qu'il se termine là où il perd les pédales.

Ce dont je suis quasiment certain:
- il se repère avec les balises ( dès qu'il voit ce qui ressemble à un vrai texte suffisamment long il doit regarder la balise principale qui ouvre l'article et il cherche la balise fermente correspondante pour se dire que c'est la fin de l'article : exemple la balise table)
- si tu as une image et que tu veux qu'elle apparaisse (c'est bien çà car tu peux avoir du trafic avec ton image dans les résultats naturels), il faut absolument que son url colle au titre dans ton code

Perso, mon problème actuel serait de le forcer à réduire le temps de prise en compte d'un nouvel article. C'est en moyenne entre 6 et 15 minutes et c'est beaucoup trop.
 
Nouveau WRInaute
Bonjour,

Je suis confronté au même genre de souci, depuis maintenant 7 jours Google News ne référence plus aucune de mes news ... j'ai beau leur avoir envoyé un mail, il me dise que tout va bien ...

J'avoue ne pu comprendre.
Quand je regarde mon panel admin google webmaster, les erreurs détectés sont "Date trop éloignée" alors qu'elle devrait apparaitre directe ...

J'avoue ne pu comprendre ... avez vous une idée ?
 
Olivier Duffez (admin)
Membre du personnel
est-ce que par hasard il y aurait des dates dans le texte de tes articles, qui ferait confondre à Googlebot avec la date de publication de l'article ? Je l'ai déjà rencontré pour le site d'un client.

Olivier
PS: bienvenue sur WRI !
 
WRInaute impliqué
Ce que dit Wri est vrai, une date dans un article lui pose des problèmes. Ce qui tend à prouver que leur technique de vérification est un peu "légère" et assez étonnante.
GG actu attend des informations du présent, pas du futur.
Si tu dis que untel sort un album demain et que son prochain sortira le 31 décembre 2009, t'es mort, ton article ne paraitra jamais.
Dans ce cas, je ne mets pas la date, j'attends qu'il vienne prendre l'article et je l'a rajoute après coup pour re-rendre l'info cohérente
 
WRInaute passionné
>e-kiwi, le plus simple ne serait pas tout simplement de regarder un peu ce que font les cadors de Google News ua niveau des codes sources, les meilleurs ayant toujours raison?

(au passage je tombe de plus en plus souvent sur des articles du Monde depuis Google News... redirigés vers des pages vides, l'articel ayant changé de place. scandaleux. )
 
Olivier Duffez (admin)
Membre du personnel
Dans le menu de gauche : Diagnostic > Explorer les sites d'information, puis le lien "Erreurs propres aux actualités" en haut du contenu central
(ce n'est accessible que pour ceux dont le site est retenu comme source de Google News)
 
WRInaute discret
Ces derniers jours, j'ai plusieurs articles qui n'ont pas été acceptés par GNews pour la raison suivante : "date trop éloignée". Or, les dates de publication sont les 20 et 21 octobre.

Date trop éloignée 20 oct. 2008
Date trop éloignée 21 oct. 2008

est-ce que cela est arrivé à quelqu'un ?
 
Nouveau WRInaute
Up!

e-Kiwi, as tu résolu ton problème? J'ai moi aussi ce problème, sur environ 95% de mes articles. Je penche aussi pour une mauvaise structure, mais plutôt de mes pages listes. Je me lance dans une phase de A/B testing. Peux-tu nus tenir au courant de tes avancées?
 
WRInaute accro
ah moi ca y est je n'ai plus de problème sur Google News. j'ai fait un bon lifting de la page article, viré la colonne du milieu et quasiment toute la colonne de droite, il reprend 95% de mes articles maintenant.
 
Nouveau WRInaute
Cool, je me disais bien aussi que la proportion de l'article dans la page avait une importance :)

tu peux nous afficher un "avant-apres" d'une page article stp, je suis curieux de voir le lifting
 
Nouveau WRInaute
Bonjour,

J'ai le même souci avec Google News. Il me dit le plus souvent Article trop long et parfois titre introuvable. Mon site est onstruit avec Joomla et je publie entre 3 et 5 articles par jour, mais aucun n'est référencé dans Google News, alors que Google a validé mon site.

e-kiwi, tu dis que tu as fait un lifting sur ton site et que cela a résolu le problème.

e-kiwi a dit:
ah moi ca y est je n'ai plus de problème sur Google News. j'ai fait un bon lifting de la page article, viré la colonne du milieu et quasiment toute la colonne de droite, il reprend 95% de mes articles maintenant.

Peux-tu m'en dire plus ? Qu'est-ce que tu as nettoyé qui permet maintenant que tes articles soient référencés par Google News ?

Merci d'avance pour votre aide.
 
WRInaute accro
salut,

j'ai toujours 50% des articles indexés ... je ne sais toujours pas pour cet "article trop long". on fait une v4 de la page article dans quelques semaines, j'en saurai plus à ce moment là :)
 
WRInaute discret
Il y a aussi le problème des images. Je n'ai toujours pas réussi à comprendre les critères à respecter pour qu'elles soient prises en compte.
 
WRInaute discret
WebRankInfo a dit:
Al-Kanz a dit:
Il y a aussi le problème des images. Je n'ai toujours pas réussi à comprendre les critères à respecter pour qu'elles soient prises en compte.
le cadeau du jour : voilà la solution : http://www.zorgloob.com/2009/02/comment-publier-ses-images-sur-google.asp

Merci du cadeau, je l'ai lu il y a quelques jours, mais ça ne fonctionne pas toujours.
Ce qui est étrange, c'est qu'alors que je suis depuis deux ans référénce sur GN, voilà plusieurs mois que les images ne passent presque plus ou de façon hasardeuse (=impossible de comprendre pourquoi deux images aux mêmes caractéristiques sont pour l'une acceptée, pour l'autre refusée).
 
WRInaute discret
WebRankInfo a dit:
l'image doit être d'une taille "suffisante"

certes, certes, mais celle de Zorglob, sont de cette taille et pourtant elles passent : http://news.google.fr/news?ned=fr&hl=fr&q=zorgloob
et l'an dernier, mes images étaient de cette taille (volontairement) et elles passaient

d'ailleurs le "suffisant" est vraiment très très flou :), car certaines images, même bien plus grandes ne passent pas.

En revanche, j'ai l'impression que si on met un titre à une image, sous l'image, ça passe mieux. A tester
 
Olivier Duffez (admin)
Membre du personnel
j'ai 2 conseils :
1- retirer le lien sur la balise h1 (lien vide d'ailleurs), ça ne plait pas à Google News
2- mettre l'image juste après le titre dans le code (déjà dit par le kiwi...)
 
WRInaute accro
WebRankInfo a dit:
j'ai 2 conseils :
1- retirer le lien sur la balise h1 (lien vide d'ailleurs), ça ne plait pas à Google News
bonjour,

Je reprends en cours car dans le même cas de figure.

il me semblait pourtant avoir lu dans GG guideline que les balises H1 était recommandée pour le titre de l'article.

Par contre je suis dans le même cas de la non prise en compte des images, et depuis quelques jours différents tests qui ne mènent à rien.

L'avantage c'est que mes articles sont tous pris en compte (bon je n'en fait pas des masses chaque jour à la différence de certains :-D) mais ce qui me chagrine c'est les images qui ne passent pas.

Exemple:
-http://www.thesiteoueb.net/modules/news/article.php?storyid=3723
-http://news.google.fr/news?ned=fr&ncl=dYUrdmb3Rg3uC-M7kagXm-dfW5caM

Je vais essayer avec des images plus grandes, actuellement je les limites.
 
WRInaute accro
cthierry, il ne dit pas de retirer la balise, mais le lien dans la balise.

sinon ton image d'exemple fait 140px × 142px là où il est conseillé > 250px
 
WRInaute accro
e-kiwi a dit:
cthierry, il ne dit pas de retirer la balise, mais le lien dans la balise.

sinon ton image d'exemple fait 140px × 142px là où il est conseillé > 250px

autant pour moi, j'avais lu trop vite :-D <=[mode desole]

Pour l'image on vient en effet d eme conseiller de passer par des 300 pour tester.

Merci a toi !

Thierry
 
WRInaute accro
Bon après différents tests et demandes jusqu'au Google Help News, pas d'avancés.

La dernière news n'est pas prise en compte pour l'image:
-http://www.thesiteoueb.net/modules/news/article.php?storyid=3727

Il m'a été conseillé de mettre l'image avec le texte pour une meilleure prise en compte. J'ai essayé devant dessous, bref dans tous les sens, et rien :-D. De plus je remarque que beaucoups de sites n'ont que des toutes petites images bien loin du 250.

Franchement je n'y comprend plus rien.

Thierry
 
WRInaute accro
Oups il n'y a pas le bouton éditer, et je ne cherche pas le flood. :-D

Bon après 437 essais :-D j'ai enfin réussi.
 
Nouveau WRInaute
Salut à tous,

Je désespère d'être référencé dans Google News. Mon site a été accepté, le sitemap est en place, j'ai quelques erreurs mais pas trop et un contenu qui ne me semble pas dénué de tout intérêt.
Je ne sais plus comment faire...
Je me dis qu'il y a peut-être quelque chose d'enOOOrme sur mon site qui empêche l'indexation et que je n'ai pas vu.

Voici l'adresse de mon site bordeaux7.com si quelqu'un y voit quelque chose de complètement incompatible avec Google News, je suis preneur.

Merci !
 
WRInaute discret
WRInaute accro
la structure d'un site peut empêcher à google de bien déterminer le début et la fin de l'article, donc j'aurai tendance à te répondre "oui"
 
WRInaute discret
e-kiwi a dit:
la structure d'un site peut empêcher à google de bien déterminer le début et la fin de l'article, donc j'aurai tendance à te répondre "oui"

dans l'ancienne version de mon site, tous les articles avec photo passaient. Depuis la dernière version, très très peu (1 sur 100 peut-être) passent. Mais je n'arrive pas à trouver ce qui cloche (en sachant que j'ai appliqué tout ce qu'il faut sur l'image elle-même, alt, title, nom original, etc.)
 
Nouveau WRInaute
Bonjour à tous,
Mon site a été accepté récemment sur google actualités, mais mes articles n'apparaissent pas; sur google webmaster tool j'ai un message d'erreur "date trop éloignée".
J'ai regardé mes articles (http://www.cotes.fr/actualites) et ai remarqué que la date était au format mm/dd/aaaa. Peut-être google interprète t'il une date 09/07/2010 comme le 9 juillet 2010 ? Du coup j'ai modifié le format de mes dates. Mais les articles n'apparaissent toujours pas.
Si quelqu'un a rencontré le même problème merci pour votre aide !
Thomas
 
WRInaute accro
cla a dit:
Bonjour à tous,
Mon site a été accepté récemment sur google actualités, mais mes articles n'apparaissent pas; sur google webmaster tool j'ai un message d'erreur "date trop éloignée".
J'ai regardé mes articles (http://www.cotes.fr/actualites) et ai remarqué que la date était au format mm/dd/aaaa. Peut-être google interprète t'il une date 09/07/2010 comme le 9 juillet 2010 ? Du coup j'ai modifié le format de mes dates. Mais les articles n'apparaissent toujours pas.
Si quelqu'un a rencontré le même problème merci pour votre aide !
Thomas
Perso j'en vois 2:
http://news.google.fr/news/search?aq=f&pz=1&cf=all&ned=fr&hl=fr&q=site ... w.cotes.fr
 
Discussions similaires
Haut