Similitude >90% entre plusieurs milliers de pages

Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics

Kijer
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 133
Inscription: Sam Sep 09, 2006 0:12

Similitude >90% entre plusieurs milliers de pages

Message le Mar Nov 27, 2007 10:20

Bonjour,

J'aurai besoin de votre expérience pour savoir ce que vous feriez pour éliminer ce duplicate content.

Disons pour résumer que j'ai 750 metiers presentés en tableau qui s'affichent sur autant de villes qu'il y a en france. seul hic ce tableau represente un % majeur sur ses pages, etant toutes dynamiques, je n'ai pas de textes supplementaires a poser sur chacune d'elle pour recuperer le probleme.

On m'a parlé d'une astuce qui consisterai a utiliser une iframe sur ce tableau afin que Google ne le lise pas en allant sur la page, et donc recupère ce pb de duplicate.

Info ? Intox ?

Je suis pas vraiment un adepte des frames, donc si vous connaissez des astuces plus efficaces ou plus respectables des standarts je prends,

Merci


Cendrillon
WRInaute accro
WRInaute accro
 
Messages: 4747
Inscription: Mar Aoû 17, 2004 15:41

Re: Similitude >90% entre plusieurs milliers de pages

Message le Mar Nov 27, 2007 11:35

Kijer a écrit:Info ? Intox ?


Info ! Lorsque la partie statique de la page est très importante par rapport à la partie dynamique, tu n'as pas d'autre choix que d'en soustraire une partie au moteur. Pour cela tu as plusieurs possiblité : en mettre une partie sous forme d'image, en déporter une partie dans un iframe, voire même faire écrire une partie de ce texte static en javascript. Toutefois il faut veiller à ce qu'il en reste suffisament sur la page pour qu'elle ne soit pas tout simplement ignorée par les moteurs.

l'idéal pour que les pages ne soient pas considérées comme duplicate content, il faut être en dessous de 70 voire 60% de similarité. Tu es à 90 c'est au minimum 20% de trop !


Leonick
WRInaute accro
WRInaute accro
 
Messages: 12177
Inscription: Dim Aoû 08, 2004 20:24

Message le Mar Nov 27, 2007 11:39

la solution est de na pas laisser indexer des pages sans contenu spécifique. Sinon, ça s'appelle du spamindex, et c'est ce que google est en train de nettoyer ces temps-ci

Kijer
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 133
Inscription: Sam Sep 09, 2006 0:12

Message le Mar Nov 27, 2007 11:47

Ok, j'ecoute vos avis pour le moment avant de choisir une solution parmis vos réponses, par contre si je bascule ses pages en no index dans le meta de ses pages, google n'indexera pas la page mais suivra tout de meme les liens ?


ybet
WRInaute accro
WRInaute accro
 
Messages: 6755
Inscription: Sam Nov 22, 2003 8:37

Message le Mar Nov 27, 2007 12:10

Leonick a écrit:la solution est de na pas laisser indexer des pages sans contenu spécifique. Sinon, ça s'appelle du spamindex, et c'est ce que google est en train de nettoyer ces temps-ci



Effectivement ....

L'autre solution est de rajouter un champ dans ta base de donnée où tu insère un texte spécifique pour chaque page.

Et oui, c'est beau le PHP couplé à une base de donnée. On crée en quelques minutes des centaines de pages, puis on songe à les remplir après .... et on se retrouve avec des centaines de pages ... vides.


HawkEye
Modérateur
Modérateur
 
Messages: 14959
Inscription: Lun Fév 23, 2004 12:33

Message le Mar Nov 27, 2007 15:07

Kijer a écrit:Ok, j'ecoute vos avis pour le moment avant de choisir une solution parmis vos réponses, par contre si je bascule ses pages en no index dans le meta de ses pages, google n'indexera pas la page mais suivra tout de meme les liens ?


Code: Tout sélectionner
<meta name="robots" content="noindex,follow" />

Kijer
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 133
Inscription: Sam Sep 09, 2006 0:12

Message le Mar Nov 27, 2007 16:08

Nickel, bon je vais mettre cette balise sur mes bases de transition !

Que vont devenir les milliers déjà indexés ?


ybet
WRInaute accro
WRInaute accro
 
Messages: 6755
Inscription: Sam Nov 22, 2003 8:37

Message le Mar Nov 27, 2007 16:35

HawkEye a écrit:
Code: Tout sélectionner
<meta name="robots" content="noindex,follow" />


Je jouerais pas trop à ça ..... Si GG considère que ces pages sont uniquement faites pour faire des liens ..... Ca va revenir strictement au même.
Code: Tout sélectionner
<meta name="robots" content="noindex,nofollow" />

Kijer
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 133
Inscription: Sam Sep 09, 2006 0:12

Message le Mar Nov 27, 2007 17:40

Ouai mais non .. en finalité j'ai mes fiches clients, c'est juste la structure pour y arriver qui passe par des pages quasi similaires (nom de ville en difference)


Leonick
WRInaute accro
WRInaute accro
 
Messages: 12177
Inscription: Dim Aoû 08, 2004 20:24

Message le Mar Nov 27, 2007 17:52

J'ai un peu de mal à comprendre : en fait, ton site a quelques milliers (ou dizaines de milliers) de pages qui correspondent à une ville et une profession ? et là dedans, tu as quelques fiches de remplies et qui correspondent à tes clients. C'est ça ?

Kijer
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 133
Inscription: Sam Sep 09, 2006 0:12

Message le Mer Nov 28, 2007 9:58

Le but n'etait pas de donner le lien, mais tu comprendra mieux en y alant directement !

ICI


UsagiYojimbo
WRInaute accro
WRInaute accro
 
Messages: 5075
Inscription: Mer Nov 23, 2005 10:38

Message le Mer Nov 28, 2007 10:12

Kijer a écrit:Le but n'etait pas de donner le lien, mais tu comprendra mieux en y alant directement !

ICI


Tu peux aussi modifier un peu tout ça et augmenter les données affichées sur les pages des tableaux :

- détail sur les villes (nombre d'habitant, adresse de la mairie, etc.)
- détail sur les professions


Leonick
WRInaute accro
WRInaute accro
 
Messages: 12177
Inscription: Dim Aoû 08, 2004 20:24

Message le Mer Nov 28, 2007 10:29

c'était donc bien ce que je pensais
Leonick a écrit:la solution est de na pas laisser indexer des pages sans contenu spécifique. Sinon, ça s'appelle du spamindex, et c'est ce que google est en train de nettoyer ces temps-ci
115 000 pages avec la commande site: de google.
J'avais déjà dit ce que je pensais de cet "annuaire". Parce que créer des centaines de milliers de pages en prenant un dictionnaire des villes en France et une nomenclature des métiers, ça n'est pas dur.
Ensuite, 2 millions d'entreprises, ça veut dire récupération des données depuis un CD (bottin, pages jaunes, ??), mais avez-vous le droit, dans le contrat d'achat des coordonnées, de réutiliser ces données pour les mettre en ligne sur internet ?
En plus, la catégorie "extraction d'uranium", c'est sûr qu'on va trouver beaucoup d'entreprises de ce genre en France

En clair, si les pages sans contenu ne sont pas enlevée rapidement de google, il y a de forts risques que les 110 000 pages donnent la même chose que ça http://www.google.fr/search?q=site%3Abonweb.com& :evil:

Kijer
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 133
Inscription: Sam Sep 09, 2006 0:12

Message le Mer Nov 28, 2007 21:32

Les pages en duplicate sont soit complétés par des infos uniques a chaque page, soit mis en noindex,follow.

@Leonick : Tu es dur de me comparer a un vulgaire annuaire, si j'avais eu d'autres solutions de structures de pages, je l'aurai adopté, pas evident de faire aller google sur toutes les fiches sans decomposer en palier.


Formation recommandée sur ce thème :

Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités