Pénalité Google, levée, puis nouvelle pénalité plus inexplicable

WRInaute discret
Bonjour à tous,

En septembre 2013, mon site citation-du-jour.fr avait subi une pénalité comme beaucoup d'autres (voir https://www.webrankinfo.com/forum/t/seo-grosse-mise-a-jour-google-4-sept-2013.167541/) et perdu 90% de son trafic.

Je m'étais donc remis en cause et travaillé sur la sortie de pénalité, avec notamment :

  • - suppression des contenus dupliqués (passage de 150 000 à 10 000 URLS référencées)
    - différenciation des title, H1, H2, des contenus, etc. Sur ce point, j'écris moi-même des descriptifs sur les pages importantes, comme on peut le voir en haut de page : http://www.citation-du-jour.fr/theme/citation-confiance/
    - no index sur les filtres et les recherches, les pages sans résultats ou avec peu de contenu
    - ancres variées, moins de liens sur les pages, maillage dense
    - pagination seo avec rel next / prev et scroll infini
    - responsive design
    - refonte générale du design et mise en cache plus poussée
Et en décembre 2013, je commençais peu à peu à sortir de la pénalité, avec +15% de trafic en plus chaque mois :)

En mai 2014, mise en place d'un nouvel update Panda de Google et mon site fait partie des gagnants, il était même listé ainsi sur certains articles (cf. http://www.search-foresight.com/panda-4-0-les-gagnants-les-perdants-en-france/)

1 mois après, mes pages sont à nouveau réévaluées à la hausse et mon trafic explose, le site est en top 5 Google sur des requêtes telles que : "citation", "citation amour", "confucius", etc. Résultat mieux qu'espéré (pics à 20k visites jour en juillet).

Connaissant assez bien les recos SEO, je garde cette "ligne éditoriale" depuis janvier : à savoir, apporter du contenu frais, favoriser les commentaires, écrire moi-même les textes qui différencient les pages, et ne pas développer le site dans un but SEO.

Hier mardi 22 juillet, le site subit une nouvelle pénalité, et cette fois je ne comprends absolument pas ce qui peut la justifier.
:cry:

Autant la première fois, j'avais au moins des contenus dupliqués qui l'expliquaient, autant cette fois je suis plus qu'étonné.

Et ce qui m'étonne surtout, c'est que je n'ai rien optimisé ou changé depuis décembre 2013, les seuls changements sont des ajouts de fonctionnalité. De plus, cette fois je suis le seul à la subir me semble-t-il.

J'ai souvent devant moi des sites qui eux n'ont pas fait la remise en question, des pseudo forums avec peu de contenu récent, beaucoup de contenus dupliqués, etc. Si vous avez le temps, testez avec la requête "citation amitié" par exemple.

Donc, on suit les recos et on est pénalisé ? Je trouve fou l'énergie et le temps qu'on dépense à travailler son site pour suivre les "ordres" de google pour parfois... rien.

Voici un graphique myposeo de l'évolution du référencement, sur lequel on voit bien la 1ère pénalité, sa sortie, puis la nouvelle à la fin.



Merci d'avance de vos avis sur ce sujet !

Pour le moment, je ne change pas ma manière de travailler puisqu'il me semble faire ce qu'il faut faire...
 
WRInaute passionné
Ton site est particulièrement lent à charger. La page que tu cites en référence ne s'est pas chargée après 15 secondes. Je n'ai pas attendu plus.
 
WRInaute discret
Bonjour.

Pour info, ton site a carrément planté mon navigateur (IE8) et fait mouliner mon pc pendant 10 minutes.

Là c'est revenu à la normale mais c'était visiblement lié aux appels des fichiers JS de tes régies publicitaires.

Sinon, tu as un paquet de scripts (donc Google Analytics) et de fichiers CSS placés après ta balise de fermeture </html>. Rien de bien méchant mais autant corriger car c'est visiblement le cas sur toutes tes pages.

Au fait, pas de message particulier dans tes Outils Webmaster ?

Bon courage.

++
 
WRInaute discret
Bon hé bien pour le coup, l'hébergeur web4all a effectivement un problème là, erreur de connexion MySQL, je leur ai signalé.
Manque de bol, ça arrive quand j'essaie de faire des démos...

Sinon,
Sinon, tu as un paquet de scripts (donc Google Analytics) et de fichiers CSS placés après ta balise de fermeture </html>. Rien de bien méchant mais autant corriger car c'est visiblement le cas sur toutes tes pages.

C'est volontaire, c'est Google qui le conseille afin de ne pas bloquer l'affichage du contenu. Tu veux que je trouve la source ? Ce n'est pas beau d'un point de vue HTML mais c'est légal et encouragé.

Au fait, pas de message particulier dans tes Outils Webmaster ?

Non, ce serait trop beau. La première fois non plus.

Concernant le nombre de pubs et fichiers js externe, si on regarde les sites qui sont en 1ère page, aucun ne fait mieux, ils sont souvent plus blindés de pubs encore et ils restent classés.

J'ai déjà testé depuis 2 ans de supprimer des pubs, ça n'a jamais joué sur le classement.

Merci encore :)
 
WRInaute discret
Allez, je prie pour que ça ne soit que temporaire vu que tu es toujours dans l'index.

Pour ce qui est des scripts et css, c'est juste avant la balise </html> que c'est préconisé ou j'en perds mon latin et je change de job de suite :)

Tiens nous au courant et excellent après-midi.
 
WRInaute discret
Merci pour le lien. Je n'arrive pas y croire tellement ça pique aux yeux 8O ... Reste à me trouver une nouvelle activité :D
 
WRInaute discret
J'ai quand même mis le doigt sur un problème de performance du à la fonction gzip en PHP qui ne fonctionnait pas.

Après correction, le temps de réponse est bien meilleur :
http://www.woozweb.com/ressourcerep...jour.fr/20140204122431CFwww1269969/2014-07-24

Cela dit, je suis quasi sûr que ça n'explique pas la pénalité. J'ai toujours l'impression que les pénalités viennent des contenus dupliqués ou des sur-optimisations, vous ne pensez pas ?
 
WRInaute passionné
Supermaury a dit:
Merci pour le lien. Je n'arrive pas y croire tellement ça pique aux yeux 8O ... Reste à me trouver une nouvelle activité :D

Attends un peu avant de changer de métier !
=> La page en VF est foireuse.
https://developers.google.com/speed/docs/insights/OptimizeCSSDelivery

Regarde l'exemple et la phrase juste dessous:
Le code small.css d'origine est chargé une fois la page affichée. L'ordre d'application des règles CSS est maintenu en injectant tous les éléments <style> et <link> dans le document à l'aide du code JavaScript.
Ah ouais ? Mais il est où le code JavaScript ? L'exemple n'a rien à voir.

Par contre, en switchant en anglais (lien tout en bas de la page), tu as l'exemple avec le javascript. Et il n'y a rien après </html>.
Donc ne jamais rien mettre après </html>, Google ne conseillerait jamais ça.

Du coup j'ai testé du coup cette façon de faire, en javascript, et je dois dire que je suis sceptique sur l'intérêt et que je trouve même que ça donne au contraire l'impression que le site est plus long à charger, car la page s'affiche sans la mise en forme jusqu'à ce que tout soit chargé. Commencer à afficher la page sans que le css ne soit appliqué, ça n'a aucun intérêt, de nos jours la plupart des sites sont illisibles sans le css...
 
WRInaute discret
Oui Rick38, j'ai remarqué en effet que c'était mal traduit.

J'ai mis en place cette injection par javascript, je trouve ça efficace.

L'utilité de charger une partie du CSS à la fin est pour rapidement afficher du contenu et une mise en forme (car tout le css ne doit pas être mis à la fin) pour que le visiteur voit le résultat au dessus de la ligne de flottaison rapidement. C'est une des recos de Google via PageSpeed Insights : https://developers.google.com/speed/docs/insights/PrioritizeVisibleContent?hl=fr

Tu peux aller voir le site citation-du-jour.fr qui met en place cela. De plus le site est plus rapide désormais, on n'a plus les soucis de mercredi dernier.

Par contre, on s'éloigne du sujet. On ne parle que d'une micro optimisation qui change peu de choses, et mettre une balise après le HTML, perso, ça ne me choque pas plus que ça, Google n'est pas le W3C.

J'ai l'impression que les sujets autour des pénalités laissent... sans voix ?

Je me conseille à moi même d'observer, de ne rien faire et attendre pour le moment. Quand on pense avoir bien travaillé, pourquoi tout casser à cause d'un changement des classements qui parfois est temporaire ?
 
WRInaute accro
Si ton site était très lent pendant une période assez longue, ce n'était donc pas un hors sujet. Si le temps d'accès est maintenant revenu a la normal, en effet il est plutôt judicieux d'attendre avant d'agir. D'ailleurs agir sur quoi? Aurais tu une piste de points que tu n'aurais pas encore régler? tes bl externes par exemple?

Mais en tout cas c’est un exemple qui illustre bien que google pédale dans la semoule. Je te monte, je te vire, je te monte, je te vire. Je t'aime moi non plus...

Courage, et je te souhaites que tout ton travail fini enfin par payer et de façon définitive, et pas en dents de scie :wink:
 
WRInaute discret
Non il n'a été lent que mardi à cause d'une panne serveur MySQL; quant au cache, en fait c'est comme s'il n'y en avait pas, je ne juge pas cela catastrophique.

J'ai pour habitude d'optimiser les requêtes mysql, car j'ai travaillé sur des projets très exigeants par le passé.

La seule piste que j'aurais, c'est la pagination. Bien que j'ai suivi les recos de Google sur la pagination optimisée par utilisation des balises rel next / prev conjointes avec un canonical - et on est jamais à l'abri d'une mauvaise traduction des recos de Google comme on vient de le voir - j'ai constaté que les pages qui ressortent depuis la pénalité, c'est des pages 4 ou 5 et non la page 1, qui elle est pénalisée.

La pénalité est partielle : par exemple le thème amitié (très concurrentiel) a disparu, alors que je suis 1er pour "citation musique".

Ce que j'ai fait (je voulais déjà le faire avant) depuis la pénalité, c'est mettre un no-index sur les pages suivantes dans les paginations. Ce qui me frustre, c'est que j'avais déjà indiqué à Google dans Webmaster Tools de ne pas indexer les pages contenant les paramètres "page=" avec valeur > 1...

C'est pour moi la seule bonne explication pour le moment de la pénalité : le contenu dupliqué sur les pages suivantes (non pas sur les citations, mais tout ce qui est autour : H1, H2, colonnes).

Merci de ces retours et encouragements :)
 
WRInaute accro
normalement ajouter rel next / prev ne devrait avoir aucune influence, sachant qu'à la base google sait déjà très bien détecter la pagination (j'imagine que c'ets inutile uniquement ou la pagination n’est pas forcément évidente). Si tu as un doute la dessus tu peux de toute façon l'enlever, ça ne change pas grand chose et ça éliminera déjà ce doute.

la seule chose qui peut avoir une influence, évidemment c'est de référencer ou non les pages (ou encore mettre la balise canonical). Pourquoi ne veux tu pas les référencer? A la base hormis pour les pages de recherche, il n'y a aucune raison particulière de ne pas indexer les pages.

J'ai pour habitude d'optimiser les requêtes mysql, car j'ai travaillé sur des projets très exigeants par le passé.

tu tombe a pique car j'aurais bien besoin de quelques conseils d'optimisation de requêtes

Voir mes 2 topics :

https://www.webrankinfo.com/forum/besoin-aide-concernant-les-indexes-mysql- ... 74583.html
et
https://www.webrankinfo.com/forum/t/optimisation-requetes-jointures-index.174080/ <-- celle ci est réellement très importante et me pose un énorme problème d'optimisation

si tu pouvais y faire un tour ça serait cool :wink:
 
WRInaute passionné
chnain35 a dit:
J'ai l'impression que les sujets autour des pénalités laissent... sans voix ?

Je n'ai pas répondu sur la pénalité car en voyant ton graphique, ce que j'ai pensé, c'est "on est en juillet, son site retombe comme en mai, et il vient pleurer...". C'est pas la cata ! Une pénalité c'est nettement plus grave. L'algo qui a fait que tes mot-clés ont monté en juin a juste changé d'avis pour un tas de raisons, peut-être les concurrents s'il y en a, enfin je ne vois rien de grave... attends un mois ou deux voir si ça remonte...
 
WRInaute discret
Ok noren je jettes un oeil rapide.

Je n'indexe plus les pages de recherche heureusement mais je pense que les pages suivantes des pages de liste ne doivent pas l'être non plus, car ce n'est pas facile de distinguer ce type de page de pages de recherche.

Ce qui m'amuse c'est que certains concurrents indexent les pages de recherche sans être pénalisés. J'ai parfois l'impression d'être le seul à me poser des questions sur les canonical, les rel next, les pages de filtres et pages suivantes, dans mon secteur. Et plus je suis les recos Google, plus je suis énervé de me voir visé par les pénalités.

Je préfère ne pas citer les concurrents en question qui sans doute font aussi du bon boulot :)
 
WRInaute discret
rick38 a dit:
chnain35 a dit:
J'ai l'impression que les sujets autour des pénalités laissent... sans voix ?

Je n'ai pas répondu sur la pénalité car en voyant ton graphique, ce que j'ai pensé, c'est "on est en juillet, son site retombe comme en mai, et il vient pleurer...". C'est pas la cata ! Une pénalité c'est nettement plus grave. L'algo qui a fait que tes mot-clés ont monté en juin a juste changé d'avis pour un tas de raisons, peut-être les concurrents s'il y en a, enfin je ne vois rien de grave... attends un mois ou deux voir si ça remonte...

8) mais non je ne pleure pas, j'essaie de comprendre ;)

Non le site n'est pas revenu au niveau de mai. Mais : 12 000 visites jour. Fin mai : 18 000. Maintenant : 3500. Tu avoueras que ça fait une différence.

Les concurrents, comme je le disais, à mon avis ont des raisons d'être pénalisés, et je trouvais normal en mai d'être passé devant certains d'entre eux. Certains font des sites satellite à foison, d'autres indexent les pages de recherche pour truster les résultats.

Maintenant Google ne me remet pas à mon niveau d'avant mai, mais supprime certaines de mes urls tout bonnement;
ce qui reste : page d'accueil et page auteurs
ce qui disparait : les pages 1 des pages thématiques

Christophe
 
WRInaute discret
Pour revenir au Smilblick, je constate que des pages Facebook dont je ne suis pas l'auteur me volent mon contenu textuel, celui des descriptions de catégories, donc pas les citations mais le texte que j'écris avec mes petites mains.

Peuvent-ils me nuire et que puis-je faire pour dénoncer ce "plagiat" ?
 
WRInaute discret
Bonjour,

Je réouvre ce sujet quelques mois après, la suite des événements est assez étonnante.

1/ La pénalité a été levée fin août

Qu'ai-je modifié sur mon site ? 2 choses seulement.

Suite à vos remarques, j'ai optimisé le temps de chargement en supprimant AddThis et les fonts Google.
J'ai également mis une balise no-index sur les pages suivantes, on ne sait jamais, les duplicate content je m'en méfie.

2/ Le traffic est monté progressivement jusqu'à 25 000 visites / jour

3/ Le 25 Octobre, nouvelle pénalité ! :cry: Quasiment identique à celle de juin, car certaines requêtes restent très bien classées. Par exemple, mon site reste 1er sur "citation mariage" et "citation musique". Mais disparait pour plein d'autres.

Donc :

- c'est la 3ème pénalité (algorithmique je pense) du même genre en 1 an.
- je parviens à en sortir en gagnant à chaque fois en visite, mais en retombant dedans quelques mois après

Je n'y comprends plus rien, car je crois réparer ce qui pose problème, et puis finalement ce n'est toujours pas bon pour Google.

J'ai pensé au dernier update Penguin. Alors je regarde via Ahrefs et Webmaster Tools, sachant que je n'ai jamais tenté de gagner des liens factices. J'ai un tas de backlinks venant de forums quelconques, je ne peux maîtriser ces liens entrants.

Par exemple cette page : http://eugenelsa.unblog.fr/2012/08/02/le-bonheur/ me fait un tas de liens vers des recherches, je n'en suis pas maître. Ces recherches dirigent vers par exemple http://www.citation-du-jour.fr/?motcle=ouvrir qui renvoie une 404 (mais sans changer l'url)

Webmaster Tools quant à lui me dit que le principal domaine référent c'est web4all, mon hébergeur. En effet, j'ai gardé chez eux un sous-domaine de recette, cf par exemple http://testfb.chnain.web4all.fr/theme/citation-justice/ mais j'ai également mis un no-index et des balises canonical... Je ne vois même pas pourquoi Webmaster Tools l'indique comme domaine référent, puisqu'aucun lien ne pointe vers la prod !

Bref, je suis perdu.

Depuis plusieurs mois, le site allocitation.com s'était pris une pénalité également, et il remonte quand je retombe.
Le site top-citations.com me semble bien suroptimisé et ne bouge pas, toujours bien classé. En plus ce site redirige chez moi vers une erreur 500 ???

Merci de vos idées / aides / remarques / critiques.

Christophe
 
WRInaute discret
Hello,

j'ai bien relu ton topic, et après un test de ton site dans gtmetric je vois une grosse optimisation manquante, l'ajout des headers expires. Tu peux corriger cela facilement via l'ajout dans ton htaccess :
Code:
<IfModule mod_expires.c>
	ExpiresActive On

	ExpiresByType application/pdf								"access plus 1 year"
	ExpiresByType application/x-shockwave-flash	"access plus 1 year"
	ExpiresByType image/bmp 										"access plus 1 year"
	ExpiresByType image/gif 										"access plus 1 year"
	ExpiresByType image/jpeg 										"access plus 1 year"
	ExpiresByType image/png 										"access plus 1 year"
	ExpiresByType image/svg+xml 								"access plus 1 year"
	ExpiresByType image/tiff 										"access plus 1 year"
	ExpiresByType image/vnd.microsoft.icon 			"access plus 1 year"
  ExpiresByType image/x-icon									"access plus 1 year"
	ExpiresByType text/css 											"access plus 1 year"
	ExpiresByType video/x-flv 									"access plus 1 year"
	ExpiresByType application/vnd.bw-fontobject	"access plus 1 year"
	ExpiresByType application/x-font-ttf				"access plus 1 year"
	ExpiresByType application/font-woff					"access plus 1 year"
	ExpiresByType font/opentype									"access plus 1 year"
	ExpiresByType image/webp										"access plus 1 year"

	# The following MIME types are in the process of registration
	ExpiresByType application/xslt+xml					"access plus 1 year"
	ExpiresByType image/svg+xml									"access plus 1 year"

	# The following MIME types are NOT registered
	ExpiresByType application/mathml+xml				"access plus 1 year"
	ExpiresByType application/rss+xml						"access plus 1 year"

	# JavaScript has various MIME types
	ExpiresByType application/x-javascript 			"access plus 1 year"
	ExpiresByType text/ecmascript 							"access plus 1 year"
</IfModule>


Enfin on constate tout de même une certaine irrégularité dans la stabilité et les performances de ton hosting. Vu ton trafic tu pourrais envisager un hébergeur pro, style Gandi. Bien entendu mon site n'est pas le même, mais j'obtiens un temps de réponse moyen à 354ms chez eux, avec des pointes à 299ms et mon plus lent à 482 soit toujours en dessous des 500ms recommandées.
 
WRInaute discret
Ok merci mais ce n'est pas ça qui peut expliquer une pénalité ;)
J'ai bien des ExpiresByType dans mon .htaccess, GTMetrics dit juste je pense qu'il ne les voit pas sur les fichiers externes.
Quant à web4ll, ils me répondent toujours qu'ils hébergent des sites à plus fort volumes alors pourquoi pas le mien...

Merci LeZla
 
WRInaute accro
HS/NB: faille XSS: -http://www.citation-du-jour.fr/?o=relevance&motcle=%22%3E%3Cstyle%3Ebody{background:pink}%3C/style%3E
 
WRInaute discret
spout a dit:
HS/NB: faille XSS: -http://www.citation-du-jour.fr/?o=relevance&motcle=%22%3E%3Cstyle%3Ebody{background:pink}%3C/style%3E

Merci, oui je me doute que le site est faillible, le code est vieux et sans framework. Mais encore une fois ceci n'explique pas une pénalité.
 
WRInaute accro
Des soucis au niveau serveur peuvent tout à fait expliquer de grosses fluctuations niveau positionnement. As-tu jeté un œil aux erreurs rencontrées par le robots de Google, lors du crawl (via GWT) ? N y aurait-il pas des pics à ce niveau au moment des fortes baisses ressenties ?
 
WRInaute accro
Oui mais qu'en dit GWT ? Nan parce que les outils tiers, c'est bien beau, mais je me fierais davantage à ce qu'indique l'interface de Google. Qui te dit qu'il n'y a pas des soucis de crawl spécifique au bot, ce que tu serais bien en peine d'identifier avec ce genre d'outils ?
 
WRInaute discret
GWT dit 143 pages introuvables (j'en avais 1231 en juillet) et 0 erreurs serveur.

Temps de téléchargement d'une page : 1 106 millisecondes, stable

Je passe pas mal de temps à éplucher ce que me dit GWT, cela fait aussi partie de ma trousse d'outils en effet.

Merci
 
WRInaute discret
Pour revenir un peu plus sur les problématiques SEO, je me penche sur un comparatif.

Pourquoi la page http://www.citation-du-jour.fr/theme/citation-amour/ est pénalisée, et pourquoi la page d'un autre site pris au hasard : http://www.top-citations.com/search/label/Amour ne l'est pas ?

Que fait ce site ?
- du texte en haut un peu charabia, optimisé SEO, avec des fautes : "pour les amoureux et les passionnés des écrites"
- des liens systématiques à droite vers tous les thèmes de citations (maillage interne plat sous forme de matraquage)
- des liens en footer comme on n'en fait plus
- contenu dupliqué avec cette page : http://www.top-citations.com/search/label/Amour?max-results=6

J'arrête la liste, mais ce que je veux dire, c'est que ce site POURRAIT être pénalisé par Google si on en croit les recos Google, et il est bien classé sur pas mal de requêtes du domaine depuis pas mal de temps.

Or, de mon côté, j'ai passé pas mal de temps à analyser mes pages, leur profondeur, les ancres, les titres, etc pour :
- varier les title, h1, h2, tous paramétrables à la main
- varier les ancres (par ex. liens sur amour, aimer, aimera, amoureux...)
- optimiser le temps de chargement
- rédiger des descriptifs haut et gauche pour la majorité des thèmes
- mettre des noindex sur les auteurs avec peu de contenu, sur les pages suivantes, sur les recherches bien sûr

J'ai parfois le sentiment que le travail est pénalisé... découragement ! :cry:

Merci...
 
Discussions similaires
Haut