Démystification des pénalités Google pour duplicate content
32 messages • Page 1 sur 3 • 1, 2, 3
Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics
Démystification des pénalités Google pour duplicate content
Post très intéressant sur le blog officiel de Google:
http://googlewebmastercentral.blogspot. ... nalty.html
Bonne lecture pour ce week end
http://googlewebmastercentral.blogspot. ... nalty.html
Bonne lecture pour ce week end
The more time and resources that Googlebot spends crawling duplicate content across multiple URLs, the less time it has to get to the rest of your content.
interressant cette notion de temps
avec trop de duplicate dans le contenu du site celui ci ne sera pas totalement crawlé. Ce qui explique un peu mieux le problème de crawl des annuaires qui ont tous 2 fois au moins le même contenu. (page de resultats et fiche)
-

Bellegarde-webb - WRInaute accro

- Messages: 1147
- Inscription: Mer Juil 12, 2006 15:13
Merci Padawan2 pour nous avoir signalé cet article. 
N'importe quoi, GG détecte une phrase de 20 mots dans un texte de plus de 5000 mots d'une page et moins de 500 dans l'autre.
même des inversions de compléments d'objets directs, l'utilisation de temps de congugaisons différentes, singulier / pluriel et synonymes sont maintenant détectés.
Comme dab, une manière de Google de communiquer pour raconter une partie de ce qui existe ...
Ils feraient mieux de s'occuper des failles de Chrome au lieu de tenter ces manipulations des Webmasters ...
Pas forcément, une espèce de trustrank sur le site, dans les vérifications de duplicate dans les annuaires, pas 10 annuaires sont repris, les autres en résultats ... ignorés mais consultables.
Et je suis beaucoup plus en avance que la majorité des visiteurs de WRI. Suffit de vérifer mes derniers posts.
Une manière pour GG de donner un renseignement qu'on a déjà .... et de minimiser.
Bref, du commercial outrance ...
même des inversions de compléments d'objets directs, l'utilisation de temps de congugaisons différentes, singulier / pluriel et synonymes sont maintenant détectés.
Comme dab, une manière de Google de communiquer pour raconter une partie de ce qui existe ...
Ils feraient mieux de s'occuper des failles de Chrome au lieu de tenter ces manipulations des Webmasters ...
carrel a écrit:We select what we think is the "best" URL to represent the cluster in search results.
Ouais Bof, la prime de fraicheur leur fait prendre le plus récent
Pas forcément, une espèce de trustrank sur le site, dans les vérifications de duplicate dans les annuaires, pas 10 annuaires sont repris, les autres en résultats ... ignorés mais consultables.
Et je suis beaucoup plus en avance que la majorité des visiteurs de WRI. Suffit de vérifer mes derniers posts.
Une manière pour GG de donner un renseignement qu'on a déjà .... et de minimiser.
Bref, du commercial outrance ...
ybet a écrit:N'importe quoi, GG détecte une phrase de 20 mots dans un texte de plus de 5000 mots d'une page et moins de 500 dans l'autre.
même des inversions de compléments d'objets directs, l'utilisation de temps de congugaisons différentes, singulier / pluriel et synonymes sont maintenant détectés.
je suis d'accord avec toi sur ce point, par contre que GG abrège le crawl si le site est bourré de duplicate car il attribue un temps donné a ne pas depasser, moi j'y crois.
Ca parait logique, avec 100 pages, si a chaque page il doit aller voir si il n'y a pas le meme contenu dans les 100 autres pages, c'est forcement long comme routine et ca consomme beaucoup en temps machine, en électricité. D'ou le probleme des annuaires qui affiche la meme description dans leurs pages de resultats et sur la fiche individuel du site.
en fait la meilleur chose a faire serait de tronquer la description sur les pages de resultats. Je sens qu'il a y une piste de ce coté
KOogar a écrit:je suis d'accord avec toi sur ce point, par contre que GG abrège le crawl si le site est bourré de duplicate car il attribue un temps donné a ne pas depasser, moi j'y crois.
Sans continuer ici un truc qui est déjà posté sur d'autres posts, les pages sanctionnées (duplicate, structure de site, contenu avec presque que des liens) avec la petite barre verte moche sont en moyenne trois fois moins visitées par les robots que les autres, c'est pas lié au temps d'indexation du site, c'est un blocage effectif des robots lors du chrole du site ... sauf que vérifier la date du cache n'apporte généralement pas grand chose, entre le cache et la date du cache, il peut y avoir plusieurs jours de différence, voire semaines pour les petits sites, y compris la date affichée fausse par rapport au contenu caché.
Par contre, effectivement lorsque le contenu est corrigé, les pages réapparaissent dans les recherches plus ou moins rapidement selon le taux de sanction (duplicate pour les annuaires) ... marfois même mieux qu'on ne crois.
-

Thierry Bugs - WRInaute accro

- Messages: 4366
- Inscription: Mer Juin 16, 2004 0:15
ybet a écrit:... c'est pas lié au temps d'indexation du site,
c'est un blocage effectif des robots lors du chrole du site ... ...
Ybet bravo, c'est digne du best off
Thierry Bugs a écrit:ybet a écrit:... c'est pas lié au temps d'indexation du site,
c'est un blocage effectif des robots lors du chrole du site ... ...
Ybet bravo, c'est digne du best off
-

Rod la Kox - WRInaute accro

- Messages: 1812
- Inscription: Mar Juin 24, 2008 15:03
ybet a écrit:un jour faudra que j'utilise un système pour parler et que ca s'écrive directement (speeddragon faisait ca je crois) ...
Ca existe, les traducteurs l'utilisent.
ybet a écrit:Thierry Bugs a écrit:ybet a écrit:... c'est pas lié au temps d'indexation du site,
c'est un blocage effectif des robots lors du chrole du site ... ...
Ybet bravo, c'est digne du best off
un jour faudra que j'utilise un système pour parler et que ca s'écrive directement (speeddragon faisait ca je crois) ... J'avoue, je tape à 2 doigts assez rapidement, ca explique toutes les inversions de caractères dans mes posts.
Enfin là on parle pas d'inversion de caractères ;p
Crawl et chrole... A part le c (qui est d'ailleurs en bonne position) tout est faux et j'ai beau regarder mon clavier, je vois pas de faute de frappe possible ;p
-

Rod la Kox - WRInaute accro

- Messages: 1812
- Inscription: Mar Juin 24, 2008 15:03
Il est obnubilé par "Chrome", voilà tout.
Pour le php, il nous sortira "l'optimisation via tache Chrom"
Coté cuisine, il se fera un bon chromchrombre...
Pour le php, il nous sortira "l'optimisation via tache Chrom"
Coté cuisine, il se fera un bon chromchrombre...
32 messages • Page 1 sur 3 • 1, 2, 3
Formation recommandée sur ce thème :
Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Comment éviter les contenus dupliqués (avec/sans le www)
- Comment lutter contre les mauvaises redirections 302 (temporaires)
- L'effet sandbox sur Google
- link rel=canonical pour réduire les contenus dupliqués
- Conseils de Google pour exploiter au mieux son site web
- Optimiser le référencement d'un blog Dotclear : balises TITLE et META
- Articles de R et D sur le PageRank, le SpamRank et le spam...
- Nouvelles fonctionnalités pour Google Sitemaps
- Liste d'erreurs classiques de duplicate content
- Sandbox, blacklistage et autres pénalités de Google
- Détection de pages dupliquées
Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages). Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation... Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités







le forum