probléme de pages similaires
22 messages
• Page 2 sur 2 • 1, 2
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
-

HawkEye - WRInaute accro

- Messages: 17005
- Inscription: 23 Fév 2004
bigguiz a écrit:Ce que je voudrais savoir c'est si Google ne cherche que les pages exactement identiques on si il prend aussi celles qui ressemblement
Google n'a rien à f* du design des pages...
Ce qu'il interprète est une similarité du contenu textuel (certains l'évaluent à 80% de similarité).
Si google comparait le design des sites, je comprendrais pourquoi il met tant de temps à crawler... T'imagines le temps machine nécessaire à calculer une similarité graphique pixel par pixel ???
De plus, tous les sites construits sur des kits graphiques identiques seraient similaires... Or, ce n'est pas le cas !
Concerant le RECIM: Tu peux vérifier si on peut considérer ça comme du plagiat, en utilisant www.copyscape.com ...
@+
-

HawkEye - WRInaute accro

- Messages: 17005
- Inscription: 23 Fév 2004
dixenet a écrit:Comment vous expliquer : google indexe en effet du contenu. mais en fait lui resoit du html et de ce html il sort le contenu pour qu'une page soit considere comme diuplicate, il faut simplement que le HTML soit identique pas le contenu. si le HTML est identique forcement que le contenu l'est aussi. vous voyez ?
... dans ce cas, je te fais une copie conforme d'un site en utilisant un code html totalement différent (mise en page CSS par exemple), et je ne suis pas similaire ?
-

HawkEye - WRInaute accro

- Messages: 17005
- Inscription: 23 Fév 2004
Non, dixenet, le fait d'avoir un contenu textuel très similaire rendra tes pages similaires.
Le fait d'avoir deux pages à contenu textuel identique, mais contenu graphique différent rendra tes pages similaires.
Le fait d'avoir deux pages sensiblement différentes, au layout graphique parfaitement identique, ne rendra pas tes pages similaires.
C'est pur texte. GoogleBot n'interprète pas le contenu graphique.
Le fait d'avoir deux pages à contenu textuel identique, mais contenu graphique différent rendra tes pages similaires.
Le fait d'avoir deux pages sensiblement différentes, au layout graphique parfaitement identique, ne rendra pas tes pages similaires.
C'est pur texte. GoogleBot n'interprète pas le contenu graphique.
- spidetra
- WRInaute passionné

- Messages: 1500
- Inscription: 7 Juil 2003
Voici mes expériences en terme de Duplicate Content :
Ce dont je suis a peu près sur :
Nom de domaine ancien : > 5 ans.
1. Ce n'est pas un site en entier qui est sanctionné, mais des pages individuelles.
2. En cas de tres fort duplicate content :
Quelques milliers de pages web strictement identique.
Chaque page web sous une quinzaine d'urls différentes. Google garde 2 à 3 copies max / pages web. Toutes les autres urls ne sont pas indexées.
3. Duplicate content fort :
Tjrs pareils quelques milliers de pages web. Chaque page web n'est présente que sous 3 ou 4 urls différentes.
La sanction de Google est moins évidente ( attention : je n'ai pas dit inexistente ).
Ce qui est du domaine de l'hypothétique :
- Sanction relativement forte en cas de duplicate content pour les nouveaux sites ( < 1 an ). J'ai l'impression qu'avec un taux de similarité faible ( autour de 50%), les nouveaux sites subissent l'effet du duplicate content.
Ce n'est qu'une hypothése.
D'autres facteurs peuvent expliquer la mauvaise indexation du site :
- PR faible
- Pb technique sur le site
- etc...
Ce dont je suis a peu près sur :
Nom de domaine ancien : > 5 ans.
1. Ce n'est pas un site en entier qui est sanctionné, mais des pages individuelles.
2. En cas de tres fort duplicate content :
Quelques milliers de pages web strictement identique.
Chaque page web sous une quinzaine d'urls différentes. Google garde 2 à 3 copies max / pages web. Toutes les autres urls ne sont pas indexées.
3. Duplicate content fort :
Tjrs pareils quelques milliers de pages web. Chaque page web n'est présente que sous 3 ou 4 urls différentes.
La sanction de Google est moins évidente ( attention : je n'ai pas dit inexistente ).
Ce qui est du domaine de l'hypothétique :
- Sanction relativement forte en cas de duplicate content pour les nouveaux sites ( < 1 an ). J'ai l'impression qu'avec un taux de similarité faible ( autour de 50%), les nouveaux sites subissent l'effet du duplicate content.
Ce n'est qu'une hypothése.
D'autres facteurs peuvent expliquer la mauvaise indexation du site :
- PR faible
- Pb technique sur le site
- etc...
22 messages
• Page 2 sur 2 • 1, 2
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Analyse de pages similaires - 21-02-2005
- Mon Compte WRI : les Google Tools de WebRankInfo - 06-01-2004
- Nouvelle version du TouchGraph Google Browser - 25-01-2003
- Google Trends : un pas vers le web social ? - 22-12-2005
- Nouvel outil dans le forum WebRankInfo - 27-03-2006
- Outil de suggestion de mots sémantiquement proches - 02-03-2005
- Obtenir de nombreux backlinks : conseil n°2 en référencement - 04-08-2008
- Tous les outils à connaître pour analyser un site - 16-09-2004
Consultez la description détaillée des produits ou services de Google suivants : Google Présentations
- Détection de pages similaires
Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages). Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation... Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués. - Touch Graph Google Browser
Description du TouchGraph Google Browser (outil externe) : il s'agit d'un outil graphique permettant de visualiser des sites similaires (selon Google). On peut sauter de site en site, et se rendre compte facilement des communautés de sites, ou des nébuleuses de sites traitant du même sujet. - Partenaires pour échanges de liens
Cet outil vous liste quelques sites qui font des liens vers des sites similaires au vôtre, pour vous aider à trouver des partenaires pour des échanges de liens.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités

