Les pénalités Google d'octobre 2007 à sept 2008

Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics

Jeff-man
Nouveau WRInaute
 
Messages: 5
Inscription: Ven Mai 30, 2008 15:08

Message le Mar Sep 23, 2008 8:08

tres bonne analyse, merci


HawkEye
Modérateur
Modérateur
 
Messages: 15032
Inscription: Lun Fév 23, 2004 12:33

Message le Mar Sep 23, 2008 8:51

ybet a écrit:Viens de vérifier les parties de l'annuaire de dico, à chaque fois, duplicate avec WRI, les pages spécifiques aux sites dans l'annuaires quasimement toutes grisées dès qu'il y a un autre annuaire qui reprend la même (trouvé indexweb par exemple)


Petite précision de langage: ce n'est pas indeXweb.info qui "reprend" la description, mais bien les webmasters qui soumettent un contenu identique à plusieurs annuaires (ce qui est d'autant plus suicidaire quand on le soumet à des annuaires à forte visibilité que quand on le soumet en automatique).

Bon nombre d'annuaires "sérieux" requièrent ou recommandent une description dite "longue", précisément dans le but de:

- forcer les gens à écrire, donc augmenter les chances d'avoir un contenu unique
- réduire les effets de duplication de contenu (cas de 1 à 2 phrases recopiées partout).

Lorsque précisément, sur ce genre d'annuaires, on fait un copié-collé de sa homepage, de sa page de "présentation", voire depuis un fichier .txt posé sur un coin du bureau... les effets sont probablement encore pires.

Pour éviter ça, j'envoie un avertissement assez clair (je l'espère... ) depuis plusieurs semaines: http://annuaire.indexweb.info/reference ... ml#warning ;)

jfcontart
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 178
Inscription: Sam Sep 22, 2007 18:29

Message le Mar Sep 23, 2008 10:25

MERCI YBET (je le dis haut et fort :-) )

je vais reprendre tes points pour donner un peu de ma médiocre expérience :-)


point n° 4, 5, 6
j'ai particulièrement apprécié les nouvelles notions "littéraire" de GG (duplicata/synonyme/orthographe/grammaire) et cela va me faire gagner du temps (j'allai lancer un site de vente spécialisé avec des articles trop proche de par la spécialité et donc dans leur présentation) donc MERCI (merci aussi HawkEye) au moins une semaine de gagnée! :-)
par contre pour mon www c'est un travail de 3-4 mois pour le modifier et le mettre aux normes "iso-ybet-2008"

point n°1
pour la pénalité de vente de lien... le problème peut-être inversé et GG n'en prend pas compte. Avant j'avais un lien depuis un site mieux classé, (en fait il s'est mieux classé car les gens passaient par lui pour accéder à mon www, le webmaster piratant mon formulaire du dictionnaire) ...pas grave... puis une fois devant, il vire mon lien. Je vois une baisse de VU, je le contacte et il me demande de le payer pour remettre le lien! GG en a été averti, mais il ne puni pas ce genre de pratique : le chantage de disparition de liens ou le détournement de formulaire de recherche!

point n°3
De plus son site a une structure d'annuaire mais n'est pas basé sur un moteur php. GG semble être capable de reconnaître les moteurs d'annuaires plus que les annuaires en soi, sûrement à cause de la structure que nous (développeur) imaginons et le duplicate-content de nos descriptions (comme dit HawkEye: c'est de notre faute! Mais en même temps, à ma décharge, la description d'un dictionnaire latin-français varie peu).

La structure très "simple" (et le pseudo-code html) d'un annuaire fait sous **word** semble une valeur plus sûr pour GG (car plus amateur?!?) pourtant ses pages sont des suite de liens. Je pense que GG reconnaît des empreintes html des moteurs et pénalise aussi le mask-duplicate. C'est comme cela qu'il a éliminé nombre de wiki des résultats pourtant riche en texte.

point annexe:
toujours pour mon www, je me suis aperçu que le trafic baisse malgré un positionnement identique. Soit mon domaine passionne moins, soit les internautes changent de pratique. Le nombre de personne présentes (visiteurs et intervenants) au dernier festival européen latin grec de madame Antébi (http://www.festival-latin-grec.eu) semblent pourtant affirmer la passion pour le latin. Pareil pour le nombre d'èleves latinistes (1/2 million, constant). Le nombre d'internaute augmentant je devrais voir une augmentation du trafic avec mon positionnement identique. Alors que ce passe-t-il? http://www.google.fr/trends?q=dictionnaire+latin donne un aperçu: le nombre de recherche baisse! c'est faible mais si on l'oppose de la croissance des foyers connectés, c'est flagrant!

je ne remet donc pas en cause le latin, les étudiants, GG ou mon site, mais doit constater que les internautes changent!

Pourquoi penser que GG pénalise (pénalise "seulement" devrais-je dire)?
Pourquoi ne pas penser aussi que GG s'adapte à une évolution des demandes?
Car qui mieux que Google connait ce que recherche l'internaute?
L'algorithme(s) s'adapte pour être pertinent et on observe des dommages collatéraux. Surtout avec un système de PR contaminant (on déclasse un gros site ce qui déclasse les moyens, ce qui plombe les petits)
il y a peut-être aussi des "bugs" dans l'algo... GG ne semble pas utiliser un vrai algo mais plus des programmes d'évaluation de score avec filtres/analyseur/etc. et j'insiste sur "des".
Dernière édition par jfcontart le Mar Sep 23, 2008 10:31, édité 1 fois.


lolilol
WRInaute passionné
WRInaute passionné
 
Messages: 765
Inscription: Jeu Déc 19, 2002 16:51

Message le Mar Sep 23, 2008 10:29

Merci pour ses renseignements, une petite reco s’impose ;)

Bigbangbel
WRInaute discret
WRInaute discret
 
Messages: 80
Inscription: Mar Jan 22, 2008 15:13

Message le Mar Sep 23, 2008 12:22

Absolument magistral !
1 reco

rtb
WRInaute accro
WRInaute accro
 
Messages: 1055
Inscription: Dim Nov 14, 2004 11:56

Message le Mar Sep 23, 2008 12:34

Merci d'avoir partager ces résultats.


titiplanti
WRInaute impliqué
WRInaute impliqué
 
Messages: 430
Inscription: Jeu Nov 04, 2004 2:34

Message le Mar Sep 23, 2008 15:01

Très intéressant ! 1 reco.

Du boulot en perspective pour ceux qui gèrent des annuaires ...


ybet
WRInaute accro
WRInaute accro
 
Messages: 6788
Inscription: Sam Nov 22, 2003 8:37

Message le Mar Sep 23, 2008 17:52

HawkEye a écrit:
ybet a écrit:Viens de vérifier les parties de l'annuaire de dico, à chaque fois, duplicate avec WRI, les pages spécifiques aux sites dans l'annuaires quasimement toutes grisées dès qu'il y a un autre annuaire qui reprend la même (trouvé indexweb par exemple)


Petite précision de langage: ce n'est pas indeXweb.info qui "reprend" la description, mais bien les webmasters qui soumettent un contenu identique à plusieurs annuaires (ce qui est d'autant plus suicidaire quand on le soumet à des annuaires à forte visibilité que quand on le soumet en automatique).


Forcément :wink:

J'ai quelques tests en route, aidés par des membres de ce forum (si un ou l'autre veut donner un petit coup de main, via MP). Ca consiste à mettre quelques pages bricolées sur des sites et envoyer des liens vers ces pages de quelques domaines.

Quand Google annonce sur son bloc que c'est la première page vue par les robots qui est reprise, c'est faux. Quelques sites semblent priovilégiés et passent quasiment à tous les coups (des annuaires bien sûr, mais aussi des sites de vente en ligne, ...)

Ca fait le deuxième message (sur deux forum différents en plus) que je répond où le site du webmaster a disparu, pas de chance, il a repris sont texte d'entrée comme description dans au moins un gros annuaire (j'ai pas vérifié, mais je pense qu'il remonte) et un autre qui met exactement le même contenu de ses pages sur les sites de vente en ligne.

Mais continue à recevoir des copier/coller sur mon annuaire comme si de rien n'était ....

Ps: je lit quelques posts depuis quelques jours, j'ai l'impression que la troisième vague de duplicate commence .... J'espère juste me tromper.
Dernière édition par ybet le Mar Sep 23, 2008 18:41, édité 1 fois.


ybet
WRInaute accro
WRInaute accro
 
Messages: 6788
Inscription: Sam Nov 22, 2003 8:37

Message le Mar Sep 23, 2008 18:18

jfcontart a écrit:La structure très "simple" (et le pseudo-code html) d'un annuaire fait sous **word** semble une valeur plus sûr pour GG (car plus amateur?!?) pourtant ses pages sont des suite de liens. Je pense que GG reconnaît des empreintes html des moteurs et pénalise aussi le mask-duplicate. C'est comme cela qu'il a éliminé nombre de wiki des résultats pourtant riche en texte.

Ce n'est pas HTLM ou PHP que GG détecte, c'est la structure répétitive des forums. Fait toute tes pages en HTML en copiant le même header et la même colonne de gauche, ca sera le même problème .. C'est la structure du site qui pénalyse.

En deux, les WIKI sont la pire plaie d'Internet, ce sont en majorité eux qui copie le contenu des VRAIS sites. J'ai encore le cas avec un de ces trucs bordéliques du WREB2.0. Un farceur africain reprend comme partage d'information toutes des parties à la queue leu d'un de mes sites .... Mail au webmaster, c'est moi qui doit prouver que ca vient de mon site, en plus je dois mettre un certificat de sécurité pour rouver que je suis le webmaster, ..... Ca prépare un tribunal avec un de ces bordel américains (ou même mieux, un fameux duplicate content ...).

Mais Google les privilégie ... J'ai pas fait mes tests dans cet esprit (c'est pas mon genre), mais j'ai parfois envie de casser cette belle colaboration Google - copieurs de WIKI ... (mon petit coup de geule de la semaine :wink: )


C'est qui qui a parlé de ISO-YBET-2008?
Image

Reste plus qu'à faire comprendre à Google :oops:

PS Hawk: monte pas directement dès qu'on parle d'index, .... Les sites qui sont cités ici sont de deux groupes, ceux qui ont pris des pénalités et ... ceux qui semblent suffisamment correct pour Google pour passer devant. :lol: Dans les tests d'annuaires, WRI passe aussi devant. Et aucune intention de déclasser ou surclasser un site ou un autre (j'ai déjà répondu sur ce post à une petite réflexion mesquine sur un des site que j'ai cité), juste de donner des exemples de sites. Passer le duplicate, c'est plutôt bon pour index, ca prouve qu'il est "manuellement" bien vu pas les vérificateurs de Google.

jfcontart
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 178
Inscription: Sam Sep 22, 2007 18:29

Message le Mar Sep 23, 2008 19:06

ybet a écrit:C'est qui qui a parlé de ISO-YBET-2008?.

c'est moi! et me gueule pas dessus :-) j'y suis pour rien si t'es spolié
ybet a écrit:Ce n'est pas HTLM ou PHP que GG détecte,

j'ai pas parlé de HTLM ou PHP mais d'empreinte html comme par exemple l'usage de structure dans la dénomination d'id ou de class qui sont identiques d'un site à l'autre utilisant le même moteur (souvent open source/ free). J'ai utilisé de nombreuse fois la notion d'empreinte html pour retrouver automatiquement des informations ... par exemple on retrouve les forum phpbb via une empreinte comme "<dd class="lastpost"><span><dfn". On classe alors très vite les pages en fonction de l'empreinte qu'elle affiche. l url étant trop facilement modifiable par url-rewriting.
honnêtement en 1 mois je peut avoir 99% des empreintes des moteurs open-sources (forum/cms/e-commerce), alors GG avec sa puissance doit utiliser cette notion d'empreinte. Reste à savoir ce qu'il en fait. Mais passe au travers les sites montés de toutes pièces (comme les sites non dynamiques) ou des moteurs de site indépendant (comme mon www) d'où une autre idée le mask et le mask-duplicate (intra site ou inter site)

ybet a écrit:Fait toute tes pages en HTML en copiant le même header et la même colonne de gauche, ca sera le même problème .. C'est la structure du site qui pénalyse.

on peut par soustraction de plusieurs pages d'un même site, extraire un mask et ne plus le prendre en compte. d'où le mask-duplicate (une notion que j'ai déjà évoqué dans un de mes posts) et entre site on peut valider un mask-duplicate et donc pénalisé des sites qui sont trop similaire dans la structure (au dela du moteur ou du duplicate content)

(re)lis calmement avant de (re)piquer un phare ... :-p

les wiki t'es contre... moi aussi ... mais de nombreux wiki sont mal classés (heureusement) et GG a pris des disposition contre wikipedia (enfin moi je les vois pas mais GG le dis) j'ai dis "riche en texte" pour dire qu'il y avait beaucoup de texte, j'ai pas voulu dire "original en texte"... les wiki c'est une plaie! :(

t'as été volé... moi, on m'a piqué ma place SERP en détournant ma base durant plusieurs mois :-p mais c'était pas un wiki, ni un site dynamique. Au delà du wiki, c'est un type d'individu qui faut pénaliser: les voleurs et spolieurs !

quand à l'anti GG j'en suis un partisan! (primaire :roll: )


ybet
WRInaute accro
WRInaute accro
 
Messages: 6788
Inscription: Sam Nov 22, 2003 8:37

Message le Mer Sep 24, 2008 5:16

jfcontart a écrit: mais d'empreinte html comme par exemple l'usage de structure dans la dénomination d'id ou de class qui sont identiques d'un site à l'autre utilisant le même moteur (souvent open source/ free). J'ai utilisé de nombreuse fois la notion d'empreinte html pour retrouver automatiquement des informations ... par exemple on retrouve les forum phpbb via une empreinte comme "<dd class="lastpost"><span><dfn". On classe alors très vite les pages en fonction de l'empreinte qu'elle affiche.


Une idée à suivre probablement, j'ai pas vérifié dans les résultats de Google (sauf ton exemple, mais là je tombe sur une vingtaine de résultats de phpbb mais aussi de .... joomla).

De toute façon, GG n'a pas déclassé des paquets de sites en même temps rien qu'avec un truc de duplicate (ou autre), ...
Je vois mal des trucs aussi énormes sans une phase préparatoire. Quand je change de serveur pour un site, me lève pas le matin en me disant que je le ferais bien, puis le faire en 5 minutes en buvant ma tasse de café, je prépare le terrain avant. Google lors de ces francs déclassement devait avoir rajouté quelques champs dans ses bases de données pour chaque page (site). Lorsqu'il a tourné le bouton, les pages qui avait des caractéristiques dans un ou plusieurs champs sont automatiquement tombées, à la trappe.

Pour wikipedia, pour un site plus aidé par Google, il continue a drolement bien se porter, à peine une petite descende pendant l'été.

-http://trends.google.com/websites?q=wikipedia.org

Encore la "fausse communication" de Google, ca devient une habitude.

jfcontart
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 178
Inscription: Sam Sep 22, 2007 18:29

Message le Mer Sep 24, 2008 7:33

hi hi :-) la notion d'empreinte ne fonctionne qu'avec la notion de marqueurs multi-points: plus on a de marqueurs spécifiques moins on fait d'erreur (comme pour les empreintes digitales ou ADN) et on les utilise via des ereg. Le vrai algo c'est donc des ereg compliqués à multiples impacts et ça vaut cher :-). Pour les empreintes digital je crois me souvenir qu'il faut au minimum 7 marqueurs positifs pour avoir un match. Pour un site internet compte 3-5 (et oui un site est plus simple qu'une empreinte digitale) mais tu peux en cherche 30 si tu veux

imagine... je suis capable depuis une page de déterminer son genre (ou ses genres) (cms, forum, wiki,...) et même le moteur utilisé. Certes, certains passent à la travers mais je peux les rattraper par mot clef ("ajouter panier" ça sent grave le e-shop) , sinon, tant pis pour eux car :
Je peux classer les résultats en fonction de la demande!
par exemple avec le mot "problème + mot-clef", je favorise les forums, alors qu'avec "appareil photo + marque" je favorise les e-shop... car j'utilise aussi un filtre d'entrée qui va agir par dichotomie connotative...

La pertinence semble s'envoler. Mais en vérité j'adapte mes filtres et scores au type de demande (facile à faire, j'ai les stats de toutes les recherches). Exit les sites de news sur les APN si je favorise les e-shop... ils se déclassent sans avoir rien fait de mal. OU je fais l'inverse, je favorise les site de news et propose des adword aux e-shop que je déclasse ainsi volontairement. (qui à crier "jf = pourriture de capitaliste" :) )

GG c'est pas des cons... si je sais le faire, ils le savent. Toute la valeur de ce type de moteur de recherche (comme mon www) c'est les programmes de scores, les filtres et les bases de données et surtout la façon dont on interroge les bases!

si je te donne pas mon algo exact (y encore des dizaines de paramètres) j'imagine que GG qui pèse des milliard de $ de plus que moi va être encore plus réticent :p
le traitement de données complexes c'est un peu mon dada ... mon www traite 3,5 millions de données classé, trié, annoté, évaluée, etc.

un jour je devrais monter ma boite d'algo! :p un jour :)

squall6969
Nouveau WRInaute
 
Messages: 10
Inscription: Mar Sep 23, 2008 9:31

Message le Mer Sep 24, 2008 7:45

Bonjour,

Ayant plusieur site de e-commerce reliés au même serveur mysql, faut-il que je supprime complètement mes sites secondaire proposant des description de produit identique associé aux mêmes produits ? (même si le nom des catégories est différentes ?)


Merci


ybet
WRInaute accro
WRInaute accro
 
Messages: 6788
Inscription: Sam Nov 22, 2003 8:37

Message le Mer Sep 24, 2008 9:22

jfcontart a écrit:GG c'est pas des cons... si je sais le faire, ils le savent. Toute la valeur de ce type de moteur de recherche (comme mon www) c'est les programmes de scores, les filtres et les bases de données et surtout la façon dont on interroge les bases!


Vu comme ca, j'en doute pas ... Ce qui expliquerait peut-être que dès que je tape une requête concernant un équipement informatique général (genre ordinateur, imprimante jet d'encre, disque dur, ...) ou même d'autre on retrouve quasiment chaque fois un mélange de sites d'indications et de vente + un comparateur de prix (génaralement 1), ... il y a deux ans, les recherches de ce type étaient envahies de site de vente ...
Je pense de plus en plus que Google manipule aussi les résultats pour afficher ce que l'utilisateur à envie de voire (ou plutôt ce que ses ingénieurs et autres statisticiens linguistes, .... pensent que les utilisateurs ont envie de voire) et pas forcément les meilleurs sites, quitte à faire passer un copieur ou autre. C'est aussi valable pour les aides à la recherche en dessous, elle est pas tout à fait neutre :twisted: Chaque fois des complément, mais dans la majorité des propositions, une marque ... et une seule avec juste le nom. Sur GG.be comme sur GG.fr: disque dur -> Maxtor, imprimante jet d'encre -> epson, imprimante laser -> Brother .... (on va dire que c'est de la médisance ou que c'est pas fait exprêt).


squall6969 a écrit: faut-il que je supprime complètement mes sites secondaire proposant des description de produit identique associé aux mêmes produits ? (même si le nom des catégories est différentes ?)


Les catégories sont de la navigation, pas du contenu donc probablement pas prises en compte dans le contenu des pages produits.

Vérifie déjà les quelques sont repris dans les recherches de Google ... Ca te donnera une idée si tu dois le faire (là il y a de fortes chances) et quels sites sont "sanctionnés". Te suffira peut-être d'en garder un ou deux. Te conseille pas de tout faire le même jour non plus.

Une remarque néanmoins, Google vérifie de plus en plus les sites qui appartiennent au même webmaster. Il y a moins de sanctions (j'ai pas dit pas, j'ai dis moins) entre les sites de la même équipe (ca joue pas forcément qu'avec le WHOIS), mais aussi compte adsence, adword, compte webmaster, ... mais aussi les webmasters qui ont l'habitude de s'envoyer des lines "cadeaux"). Ca semble être valable dans les deux sens, moins applicable pour le duplicate, mais de l'autre coté les liens "externe" du même groupe ont l'air d'être moins pris en compte.

jfcontart
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 178
Inscription: Sam Sep 22, 2007 18:29

Message le Mer Sep 24, 2008 11:13

ybet a écrit: Ce qui expliquerait peut-être que dès que je tape une requête concernant un équipement informatique général (genre ordinateur, imprimante jet d'encre, disque dur, ...) ou même d'autre on retrouve quasiment chaque fois un mélange de sites d'indications et de vente + un comparateur de prix (génaralement 1), ... il y a deux ans, les recherches de ce type étaient envahies de site de vente ...


exactement... limiter une recherche avec un ESHOP=2, FORUM=3 , COMPARA= 1 ... c'est très facile :-) et ça n'empêchera pas les sites de monter "naturellement" car je ne fige pas les résultats : je les limite

Les pénalités Google d'octobre 2007 à sept 2008 Les pénalités Google d'octobre 2007 à sept 2008

Formation recommandée sur ce thème :

Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités