Supprimer du duplicate extèrieur

Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics

chimoun
WRInaute discret
WRInaute discret
 
Messages: 126
Inscription: 29 Juin 2006

Supprimer du duplicate extèrieur

Message le Mer Nov 02, 2011 13:15

Bonjour à tous,

après des mois de travail sur le référencement d'un de mes sites me voilà sans résultats.

Je cherche le pourquoi, et m'aperçois qu'un site duplique mes pages par centaines (duplication de mon propre contenu à 100%)

Voilà les urls dupliquées indexées dans google, il y en a des dizaines :
http://cvlev.vi-mobile.appspot.com/www.mondomaine.com/mapage.html
http://assci.pakgalaxy.appspot.com/www.mondomaine.com/mapage.html
http://yaxei.ivegotalovelybunch.appspot.com/www.mondomaine.com/mapage.html
http://urjyu.pakgalaxy.appspot.com/www.mondomaine.com/mapage.html
...

Comment faire pour désindexer rapidement TOUTES ces pages qui nuisent fortement à mon site par duplicate content extèrieur ?

Merci


IllusionPerdu
WRInaute discret
WRInaute discret
 
Messages: 141
Inscription: 11 Mar 2006

Re: Supprimer du duplicate extèrieur

Message le Mer Nov 02, 2011 14:45

Bonjour,

Toutes les url données sont des url de proxy.
Personnellement je n'est trouver aucune solution miracle pour les évitées...
S'il existe une solution elle m’intéresse aussi !

chimoun
WRInaute discret
WRInaute discret
 
Messages: 126
Inscription: 29 Juin 2006

Re: Supprimer du duplicate extèrieur

Message le Mer Nov 02, 2011 15:05

Oui, mais ces urls de proxy provoquent du duplicate content en masse à mon site.

Je suis quasi certain que se sont à cause d'elles que mon site est sanctionné. Il faut que je les supprime.

Penses tu que ces urls de proxy indexées sur google sont l'objet d'un geste mal intentionné ?

XGilbert
WRInaute discret
WRInaute discret
 
Messages: 219
Inscription: 10 Avr 2007

Re: Supprimer du duplicate extèrieur

Message le Mer Nov 02, 2011 16:24

Je mettrai une balise <link rel="canonical" href="http://www.mondomaine.com/mapage.html" /> sur toutes les pages du site
Je retournerai surfer sur mon site via le/les proxys, en espérant qu'ils mettent leur cache à jour.
Une seule chose, est-ce que la balise canonical est prise en compte lorsqu'elle renvoie vers un site externe ?


zeb
WRInaute accro
WRInaute accro
 
Messages: 4569
Inscription: 5 Déc 2004

Re: Supprimer du duplicate extèrieur

Message le Mer Nov 02, 2011 16:41

il y a plus rapide pour ce genre de sangsues passez directement a l'attaque.

chimoun
WRInaute discret
WRInaute discret
 
Messages: 126
Inscription: 29 Juin 2006

Re: Supprimer du duplicate extèrieur

Message le Mer Nov 02, 2011 16:45

XGilbert a écrit:Je mettrai une balise <link rel="canonical" href="http://www.mondomaine.com/mapage.html" /> sur toutes les pages du site
Je retournerai surfer sur mon site via le/les proxys, en espérant qu'ils mettent leur cache à jour.
Une seule chose, est-ce que la balise canonical est prise en compte lorsqu'elle renvoie vers un site externe ?


Effectivement, je vais installer cette balise mais je veux également supprimer les urls de proxy.

Peut être en refusant l'accès par le bloquage de l'ip du proxy via le htaccess ?


forty
WRInaute passionné
WRInaute passionné
 
Messages: 1701
Inscription: 30 Oct 2008

Re: Supprimer du duplicate extèrieur

Message le Mer Nov 02, 2011 16:47

pour bloquer les proxy il faut ajouter dans le htaccess :
Code: Tout sélectionner
#interdit AppEngine-Google
RewriteCond %{HTTP_USER_AGENT} ^AppEngine-Google
RewriteRule ^.*$ - [F,L]


zeb
WRInaute accro
WRInaute accro
 
Messages: 4569
Inscription: 5 Déc 2004

Re: Supprimer du duplicate extèrieur

Message le Mer Nov 02, 2011 16:49

chimoun a écrit:Peut être en refusant l'accès par le bloquage de l'ip du proxy via le htaccess ?

Chez moi (voir lien) j'ai suivi quelques un de ces proxy de me*de après installation de la règle dans le htaccess et j'ai pu constater que les aperçus contenaient un belle page yahoo. Donc google a bien re-crawlé ces pages et viré mon contenu pour celui de yahoo fixé par le htaccess. Bref plu de souci de duplicate (enfin pas pour yahoo mais bon ... c'est une page de recherche que j'envoie).

chimoun
WRInaute discret
WRInaute discret
 
Messages: 126
Inscription: 29 Juin 2006

Re: Supprimer du duplicate extèrieur

Message le Mer Nov 02, 2011 16:54

forty a écrit:pour bloquer les proxy il faut ajouter dans le htaccess :
Code: Tout sélectionner
#interdit AppEngine-Google
RewriteCond %{HTTP_USER_AGENT} ^AppEngine-Google
RewriteRule ^.*$ - [F,L]


Merci pour ce joli code, je vais installer ça desuite !!!! :D

Je me rends compte qu'un grand nombre de sites sont touchés par ce même problème.


zeb
WRInaute accro
WRInaute accro
 
Messages: 4569
Inscription: 5 Déc 2004

Re: Supprimer du duplicate extèrieur

Message le Mer Nov 02, 2011 17:02

et il y a pas que ça ... wiki mémorise les page citées dans ses articles aussi (en trafiquant tes pages au passage)
http://forum.webrankinfo.com/wiki-cache-publicite-t135333.html regarde ici : -http://archive.wikiwix.com/cache/?url=http://www.pointvoyance.com/

eux pour les sortir c'est encore plus simple suffit de blacklister les ip de leur serveurs

Code: Tout sélectionner
   order allow,deny
   deny from 195.221.21.171
   deny from 195.221.21.172
   deny from 195.221.21.173
   deny from 195.221.21.150
   deny from 195.221.21.225
   deny from 195.221.21.227
   deny from 195.221.21.229
   deny from 195.221.21.231
   deny from 195.221.21.235
   allow from all

On devrais dresser une liste des parasites et des contre mesures pour se faciliter la vie


forty
WRInaute passionné
WRInaute passionné
 
Messages: 1701
Inscription: 30 Oct 2008

Re: Supprimer du duplicate extèrieur

Message le Mer Nov 02, 2011 17:11

pour wikiwix c'est plutôt dans le robots.txt la solution : http://archive.wikiwix.com/cache/cache.php

chimoun
WRInaute discret
WRInaute discret
 
Messages: 126
Inscription: 29 Juin 2006

Re: Supprimer du duplicate extèrieur

Message le Mer Nov 02, 2011 21:23

forty a écrit:pour bloquer les proxy il faut ajouter dans le htaccess :
Code: Tout sélectionner
#interdit AppEngine-Google
RewriteCond %{HTTP_USER_AGENT} ^AppEngine-Google
RewriteRule ^.*$ - [F,L]


Après installation du code, quasi tous les proxy sont redirigés vers une page blanche. :D

Un seul renvoie vers ma page index.

Faut il bannir son adresse IP ?


zeb
WRInaute accro
WRInaute accro
 
Messages: 4569
Inscription: 5 Déc 2004

Re: Supprimer du duplicate extèrieur

Message le Mer Nov 02, 2011 21:25

chimoun a écrit:Un seul renvoie vers ma page index.

C'est peut être une version "en cache" de ton index (ajoute un petit truc dedans et regarde si le proxy te donne bien la même page)

chimoun
WRInaute discret
WRInaute discret
 
Messages: 126
Inscription: 29 Juin 2006

Re: Supprimer du duplicate extèrieur

Message le Mer Nov 02, 2011 21:59

zeb a écrit:
chimoun a écrit:Un seul renvoie vers ma page index.

C'est peut être une version "en cache" de ton index (ajoute un petit truc dedans et regarde si le proxy te donne bien la même page)


Apparemment tous les proxy sont pris en compte... J'espère que les pages des proxy vont maintenant rapidement se désindexer.

Et encore une fois merci pour l'aide :)


Leonick
WRInaute accro
WRInaute accro
 
Messages: 19598
Inscription: 8 Aoû 2004

Re: Supprimer du duplicate extèrieur

Message le Jeu Nov 03, 2011 9:59

forty a écrit:pour wikiwix c'est plutôt dans le robots.txt la solution : http://archive.wikiwix.com/cache/cache.php
si tu savais le nombre de bots (même officiels) qui ne respectent pas le robots.txt

Supprimer du duplicate extèrieur

Si vous avez aimé cette discussion, partagez-la sur vos réseaux sociaux préférés :

Formation recommandée sur ce thème :

Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :

  • Similarité et duplicate content
    Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages). Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation... Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués.


Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités