probléme de pages similaires
22 messages
• Page 1 sur 2 • 1, 2
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
- bigguiz
- Nouveau WRInaute

- Messages: 13
- Inscription: 7 Oct 2005
probléme de pages similaires
bonjour a tous,
j'ai un petit probléme technique. Je me suis proposé pour refaire a neuf le site du registre des citoyens du monde
seulement il y a une personne qui a créé un site chez free: [url=http://citmonde.free.fr]
et qui a mis pratiquement le même texte que le site du recim. Cette personne est injoignable et ne repond pas a ses mails.
Pour l'instant ca ne semble pas poser de probléme pour google (voir referencement sur "citoyens du monde".
Mais bon deja le site de free est quand même pouri et j'ai peur que quand je vais mettre les pages a jour, j'ai un probléme de pages similaires.
Bref j'ai peur qu'a cause de ça le site du recim soit pénalisé.
D'aprés vous, est-ce qu'il y a un risque?
j'ai un petit probléme technique. Je me suis proposé pour refaire a neuf le site du registre des citoyens du monde
seulement il y a une personne qui a créé un site chez free: [url=http://citmonde.free.fr]
et qui a mis pratiquement le même texte que le site du recim. Cette personne est injoignable et ne repond pas a ses mails.
Pour l'instant ca ne semble pas poser de probléme pour google (voir referencement sur "citoyens du monde".
Mais bon deja le site de free est quand même pouri et j'ai peur que quand je vais mettre les pages a jour, j'ai un probléme de pages similaires.
Bref j'ai peur qu'a cause de ça le site du recim soit pénalisé.
D'aprés vous, est-ce qu'il y a un risque?
-

dixenet - WRInaute discret

- Messages: 163
- Inscription: 7 Déc 2004
Je ne pense pas. D'abord parce que les designs et donc le code HTML qui le mets en page est different.
Ce n'est pas une copie complete de votre site.
Sur internet, bon nombre de site on les memes contenus, mais la mise en page differe. Et c'est la dessus que google se base.
Il ne faut pas confondre contenu proche et contenu identique
Ce n'est pas une copie complete de votre site.
Sur internet, bon nombre de site on les memes contenus, mais la mise en page differe. Et c'est la dessus que google se base.
Il ne faut pas confondre contenu proche et contenu identique
-

doic - WRInaute passionné

- Messages: 1147
- Inscription: 7 Nov 2003
Re: probléme de pages similaires
bigguiz a écrit:Mais bon deja le site de free est quand même pouri et j'ai peur que quand je vais mettre les pages a jour, j'ai un probléme de pages similaires.
Il y'a un dicton qui dit qu'il faut regarder la poutre qu'on a dans l'oeil avant de parler de la paille dans l'oeil de son prochain... Tu connais?
- bigguiz
- Nouveau WRInaute

- Messages: 13
- Inscription: 7 Oct 2005
Loin de moi l'idée de critiquer le travail de qui que ce soit
D'ailleurs son site est mieux référencé que le site "officiel"
Je ne sais pas qui a été le premier a faire un site, car je reprends tout juste le dossier.
La personne qui a fait ce site était surement pleine de bonnes intentions mais je me demande si sont initiative précipitée ne va pas s'avérer préjudiciable pour les citoyens du monde
Ce qui est domage c'est que la personne ne réponde plus.
D'ailleurs son site est mieux référencé que le site "officiel"
Je ne sais pas qui a été le premier a faire un site, car je reprends tout juste le dossier.
La personne qui a fait ce site était surement pleine de bonnes intentions mais je me demande si sont initiative précipitée ne va pas s'avérer préjudiciable pour les citoyens du monde
Ce qui est domage c'est que la personne ne réponde plus.
- spidetra
- WRInaute passionné

- Messages: 1500
- Inscription: 7 Juil 2003
amazigh25 a écrit:Bonjour;
ne t'inquiète pas trop, si la mise en page et differente le risque de page similaires et mince.
Sinon t'a essayer de contacter free ?
@+
c le 2° post qui parle de mise en page ?
Google index du contenu pas de la mise en forme, non ?
Je suis surpris par ces affirmations, vous avez des sources ?
- bigguiz
- Nouveau WRInaute

- Messages: 13
- Inscription: 7 Oct 2005
ok merci,
vu que je sais pas trop comment marche les pages similaires j'ai préféré poser la question.
Oui j'ai essayé de contacter free, ça serait bien de créer un lien entre les deux sites par exemple.
Mais free ne veut pas me donner ses coordonnées a cause de la CNIL sans doute.
Je leur ai demandé de transmettre un message, mais je sais pas si ca va marcher.
Oui j'ai essayé de contacter free, ça serait bien de créer un lien entre les deux sites par exemple.
Mais free ne veut pas me donner ses coordonnées a cause de la CNIL sans doute.
Je leur ai demandé de transmettre un message, mais je sais pas si ca va marcher.
- spidetra
- WRInaute passionné

- Messages: 1500
- Inscription: 7 Juil 2003
amazigh25 a écrit:Bonjour;
ne t'inquiète pas trop, si la mise en page et differente le risque de page similaires et mince.
D'un point de vue simpliste c'est quoi un index :
- un identifiant unique pour chacune des urls crawlées. Par exemple, peut être une clé MD5, ou tout autres ago : ID = MD5(url) ;
- Un vecteur et/ou une matrice représentant le contenu de la page.
Dans cette matrice :
- la liste des mots de l'url, et pour chacun des mots la liste des positions, des pondérations diverses, etc....
je suppose que l'index rajoute : des checksum, des vecteurs de backlinks, etc....
un calcul de similarité pourrait se faire au niveau de la matrice mots/positions. J'suis pas assez calé en calcul matriciel, mais je suppose qu'il doit être possible d'extraire des parties de matrices identiques.
Je ne dit pas que c'est comme ça que cela fonctionne ( c'est juste une hupothèse )
aucun intérêt pour Google de prendre en compte la mise en page des sites web. Donc je suis assez surpris par ces affirmations.
-

dixenet - WRInaute discret

- Messages: 163
- Inscription: 7 Déc 2004
Comment vous expliquer : google indexe en effet du contenu. mais en fait lui resoit du html et de ce html il sort le contenu pour qu'une page soit considere comme diuplicate, il faut simplement que le HTML soit identique pas le contenu. si le HTML est identique forcement que le contenu l'est aussi. vous voyez ?
- spidetra
- WRInaute passionné

- Messages: 1500
- Inscription: 7 Juil 2003
bigguiz a écrit:Ce que je voudrais savoir c'est si Google ne cherche que les pages exactement identiques on si il prend aussi celles qui ressemblement
a mon humble avis, Google recherche de la similarité.
Toute la difficulté est de savoir à quel niveau Google place la barre.
- spidetra
- WRInaute passionné

- Messages: 1500
- Inscription: 7 Juil 2003
dixenet a écrit:Comment vous expliquer : google indexe en effet du contenu. mais en fait lui resoit du html et de ce html il sort le contenu pour qu'une page soit considere comme diuplicate, il faut simplement que le HTML soit identique pas le contenu. si le HTML est identique forcement que le contenu l'est aussi. vous voyez ?
Comment t'expliquer : j'ai developper en moins d'une semaine, et avec quelques centaines de lignes Perl un programme qui va rechercher du contenu similaire ( duplicate content ) sur Internet.
Mon algo est simpliste, pas optimisé, mais je suis capable d'aller chercher deux contenus identiques ( ou fortement identique, je choisis le % de similarité que je désire ) dans deux sous-arbre html totalement différent.
Je part du postulat, a priori, que les ingénieurs de Google, soutenu par des milliards de dollars, sont, peut-être, meilleur que moi.
Si je suis capable de retrouver deux contenus similaire, dans deux pages HTML totalement différentes, tu ne penses pas que Google est est, peut-être, aussi capable.
Sinon, je suis prêt à leur vendre mes 100 lignes de perl
Oui, je récupére du HTML, et alors ? Quel est le rapport avec la mise en page.
J'ai peut-être tord, mais si google tient compte de la mise en page dans la recherche du duplicate content : quelles sont tes sources ?
Cela m'intéresse, et je suis prêt à me remettre en cause.
-

dixenet - WRInaute discret

- Messages: 163
- Inscription: 7 Déc 2004
Oui je suis d'accord avec toi mais pour que la sanction duplicate soit mise en place il faut plus qu'un simple contenu sismilaire sinon bon nombre de site serais en duplicate.
Exemple: les sites qui propose des Marques Blanche pour des Informations.
Exemple: les sites qui propose des Marques Blanche pour des Informations.
22 messages
• Page 1 sur 2 • 1, 2
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Analyse de pages similaires - 21-02-2005
- Mon Compte WRI : les Google Tools de WebRankInfo - 06-01-2004
- Nouvelle version du TouchGraph Google Browser - 25-01-2003
- Google Trends : un pas vers le web social ? - 22-12-2005
- Nouvel outil dans le forum WebRankInfo - 27-03-2006
- Outil de suggestion de mots sémantiquement proches - 02-03-2005
- Obtenir de nombreux backlinks : conseil n°2 en référencement - 04-08-2008
- Tous les outils à connaître pour analyser un site - 16-09-2004
Consultez la description détaillée des produits ou services de Google suivants : Google Présentations
- Détection de pages similaires
Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages). Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation... Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués. - Touch Graph Google Browser
Description du TouchGraph Google Browser (outil externe) : il s'agit d'un outil graphique permettant de visualiser des sites similaires (selon Google). On peut sauter de site en site, et se rendre compte facilement des communautés de sites, ou des nébuleuses de sites traitant du même sujet. - Partenaires pour échanges de liens
Cet outil vous liste quelques sites qui font des liens vers des sites similaires au vôtre, pour vous aider à trouver des partenaires pour des échanges de liens.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités
