Probleme : Page bidon indexée chez google, malveillance ?

Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics

frenot
WRInaute discret
WRInaute discret
 
Messages: 76
Inscription: Ven Déc 10, 2004 14:43

Probleme : Page bidon indexée chez google, malveillance ?

Message le Mer Oct 04, 2006 9:51

Salut à tous,

Voici un probleme que je rencontre depuis quelques temps et qui me pose certainement un probleme d'indexation (en particulier avec google) :

Le site que je gère est bebloom.com

Quand je lance la fonction site:http://www.example.com dans une recherche google, j'obtiens une liste de 1550 pages référencées, jusque là, rien de choquant.

Sur mon site, j'ai un mini moteur de recherche simple qui permet, en passant un paramêtre en url, de trouver un produit. Il s'agit de la page :
www.example.com/recherche.asp et si on passe en parametre "chocolat", on a une page qui donne tous nos produits parlant de chocolat : www.example.com/recherche.asp?recherche=chocolat

Probleme : dans mes pages indexées (cf la fonction site:http:/), je retrouve une mutlitude de pages indexées avec cette page recherche et des parametre totallement bidon, que biensur je n'ai pas sur mon site et encore moins demandé en indexation :
www.example.com/recherche.asp?recherche=ribouler
www.example.com/recherche.asp?recherche=zwinglianisme
www.example.com/recherche.asp?recherche=hachich
.... Ces pages ne sont pas pertinentes, mais arrivent sur ma page recherche qui ne donne biensur aucun résultat (pas d'erreur 404). NB : pour éviter un BL sur ces pages, j'ai enlevé mon nom de domaine des urls ci-dessus. *

Est-ce que c'est dommageable?
Comment est-ce possible ? action malveillante ?
n'importe qui peut-il indexer n'importe quelle page de n'importe quel site ?
avez-vous déjà eut ce type de probleme ?

merci pour votre aide

* Edit HawkEye: j'ai mis example.com, qui sert à ça ;)


HawkEye
Modérateur
Modérateur
 
Messages: 15032
Inscription: Lun Fév 23, 2004 12:33

Message le Mer Oct 04, 2006 10:03

Il y'a un risque de duplicate content sur toutes les pages qui ne retournent pas de résultat. Donc oui, c'est dommageable.

Note: permettre l'indexation de ses résultats de recherche internes de la sorte, ça s'apparente fort à du spamdexing. Je me doute que c'est involontaire, mais celà peut (à grande échelle...) te faire courrir un risque important.

Par simple précaution, tu devrais faire un test du style (en php, sorry asp je ne connais pas):

Code: Tout sélectionner
if($_GET['recherche']) { echo '<meta name="robots" content="none">; }


(dans le <head> de tes pages).

@++

frenot
WRInaute discret
WRInaute discret
 
Messages: 76
Inscription: Ven Déc 10, 2004 14:43

Message le Mer Oct 04, 2006 10:18

HawkEye a écrit:Note: permettre l'indexation de ses résultats de recherche internes de la sorte, ça s'apparente fort à du spamdexing.


Ce qui est etonnant, c'est de trouver des parametres bizarres en fin d'url... à croire que des tiers s'amusent à référencer des pages bidons. C'est fait avec ma page recherche, mais ça peut etre fait avec n'importe qu'elle page dans l'absolu, tu prends une page, tu lui passe un parametre bidon. Ca ressemble quand meme à un acte de malveillance, mais je comprends pas comment ça peut se produire...

HawkEye a écrit:Par simple précaution, tu devrais faire un test du style (en php, sorry asp je ne connais pas):
Code: Tout sélectionner
if($_GET['recherche']) { echo '<meta name="robots" content="none">; }

(dans le <head> de tes pages).


Pas de probleme pour traduire ça en asp, mais je ne suis pas certain que le moteur en tienne compte lors de l'indexation... je vais dans un premier temps retirer manuellement toutes ces pages.


blman
WRInaute accro
WRInaute accro
 
Messages: 2915
Inscription: Ven Sep 05, 2003 10:46

Message le Mer Oct 04, 2006 10:24

Ouah, tu gère le site bebloom. J'aurais quelques questions à te poser si un jour tu es dispo sur le chat WRI...

Bon, sinon, ne t'inquiète pas trop... Je ne pense pas que ce soit trop dramatique

Tu peux déjà essayer d'identifier d'où proviennent les liens en utilisant la commande link: sur altavista. Si tu ne trouve rien, essaye de trouver les sites qui font ces liens en faisant des recherches sur Google.

Si vraiment, le phénomène s'est généralisé, effectivement, tu pourrais avoir un petit problème de duplicate content.

Sepino
WRInaute discret
WRInaute discret
 
Messages: 89
Inscription: Lun Aoû 07, 2006 14:09

Message le Mer Oct 04, 2006 10:41

Messieurs s'il vous plait :

----------------------------------------------------------------
<meta name="robots" content="none" />
----------------------------------------------------------------

C'était juste une petite précision ;)


Suede
WRInaute accro
WRInaute accro
 
Messages: 3721
Inscription: Ven Oct 04, 2002 11:22

Message le Mer Oct 04, 2006 10:50

Si tu savais ce que les gens recherchent sur un site sur la suède. Ca va de vacances au maroc à des choses aussi inatendue. La meilleure solution est de ne pas referencer les résultats de tes recherches.


nickargall
WRInaute accro
WRInaute accro
 
Messages: 5319
Inscription: Lun Juin 13, 2005 14:13

Message le Mer Oct 04, 2006 11:24

HawkEye a écrit:Note: permettre l'indexation de ses résultats de recherche internes de la sorte, ça s'apparente fort à du spamdexing.


En quoi ça s'apparente à du spamdexing ??


blman
WRInaute accro
WRInaute accro
 
Messages: 2915
Inscription: Ven Sep 05, 2003 10:46

Message le Mer Oct 04, 2006 11:41

nickargall a écrit:
HawkEye a écrit:Note: permettre l'indexation de ses résultats de recherche internes de la sorte, ça s'apparente fort à du spamdexing.


En quoi ça s'apparente à du spamdexing ??


ça dépend si c'est utilisé à outrance ou pas... Sur un annuaire (comme beaucoup le font), oui, ça peut s'y apparenté. Sur une boutique, je sais pas.

La mode des nuages de tags (tag cloud) qui génère un lien automatique vers une page, n'est-ce pas du spamdexing, alors ?


nickargall
WRInaute accro
WRInaute accro
 
Messages: 5319
Inscription: Lun Juin 13, 2005 14:13

Message le Mer Oct 04, 2006 11:52

blman a écrit:
nickargall a écrit:
HawkEye a écrit:Note: permettre l'indexation de ses résultats de recherche internes de la sorte, ça s'apparente fort à du spamdexing.


En quoi ça s'apparente à du spamdexing ??


ça dépend si c'est utilisé à outrance ou pas... Sur un annuaire (comme beaucoup le font), oui, ça peut s'y apparenté. Sur une boutique, je sais pas.

La mode des nuages de tags (tag cloud) qui génère un lien automatique vers une page, n'est-ce pas du spamdexing, alors ?


+1
Quand je propose un accès directs aux résultats des requêtes les plus fréquentes effectuées sur mon site, je propose des regroupements de contenu aux internautes, je pense pas que ça puisse choquer les moteurs de recherche ... bon je l'admets j'ai mis ça ça en place en pensant également au référencement mais je vois pas ou pourraît être l'abus.


blman
WRInaute accro
WRInaute accro
 
Messages: 2915
Inscription: Ven Sep 05, 2003 10:46

Message le Mer Oct 04, 2006 11:58

L'abus, c'est quand tu fais indexés toutes tes recherches. Vous souvenez vous de ces sites qui avaient des millions de pages indexées par ce procédé ? (j'ai pas le droit de citer de noms sous peine d'enfreindre les règles de la charte WRI)


HawkEye
Modérateur
Modérateur
 
Messages: 15032
Inscription: Lun Fév 23, 2004 12:33

Message le Mer Oct 04, 2006 13:18

Excatement, blman ;)

L'abus c'est...

Code: Tout sélectionner
"SELECT * FROM searches";
(...)

for($i=0; $i<$nb_searches; $i++)
{ echo '<a href=".../search?q=$search[0]....';}

frenot
WRInaute discret
WRInaute discret
 
Messages: 76
Inscription: Ven Déc 10, 2004 14:43

Message le Mer Oct 04, 2006 13:34

blman a écrit:L'abus, c'est quand tu fais indexés toutes tes recherches. Vous souvenez vous de ces sites qui avaient des millions de pages indexées par ce procédé ? (j'ai pas le droit de citer de noms sous peine d'enfreindre les règles de la charte WRI)


Notre mini moteur de recherche ne rentre pas dans ce cadre, c'est un moteur simple, recherche textuel, les recherches courantes sont limitées à une 30/40 pages de résultats tout au plus, l'objectif est vraiment pas de multiplier nos pages à outrance. Sur le principe, je ne pense pas que ce type de page puisse être considéré comme du spamindexing, sauf que si google indexe ma page en collant des parametres bidons, il peut en créer des millions... et je ne comprends pas pourquoi. Seule option qui me vient en tête : une personne malveillante s'est amusé à créer ces pages, ou a faire des liens vers ces pages (genre : www.example.com/recherche.asp?recherche=ribouler avec mon domaine bebloom.com) et à les référencer dans l'index google, mais bon, c'est bien étrange...


nickargall
WRInaute accro
WRInaute accro
 
Messages: 5319
Inscription: Lun Juin 13, 2005 14:13

Message le Mer Oct 04, 2006 13:52

Ok donc à vous suivre, si je limite mon espece de tag cloud aux , je sais pas moi, 50 recherches les plus effectuées, c'est pas de l'abus, mais si je liste toutes les recherches effectuées, c'est de l'abus ??


blman
WRInaute accro
WRInaute accro
 
Messages: 2915
Inscription: Ven Sep 05, 2003 10:46

Message le Mer Oct 04, 2006 14:01

frenot a écrit:Seule option qui me vient en tête : une personne malveillante s'est amusé à créer ces pages, ou a faire des liens vers ces pages (genre : www.example.com/recherche.asp?recherche=ribouler avec mon domaine bebloom.com) et à les référencer dans l'index google, mais bon, c'est bien étrange...


Tu a essayé d'identifier qui pouvait te faire ce genre de liens bidons comme j'avais dis plus haut ?

frenot
WRInaute discret
WRInaute discret
 
Messages: 76
Inscription: Ven Déc 10, 2004 14:43

Message le Mer Oct 04, 2006 14:17

blman a écrit:
frenot a écrit:Seule option qui me vient en tête : une personne malveillante s'est amusé à créer ces pages, ou a faire des liens vers ces pages (genre : www.example.com/recherche.asp?recherche=ribouler avec mon domaine bebloom.com) et à les référencer dans l'index google, mais bon, c'est bien étrange...


Tu a essayé d'identifier qui pouvait te faire ce genre de liens bidons comme j'avais dis plus haut ?


J'ai fais des recherches, avec link, mes pages sont indexés chez yahoo et altavista (en plus de google) mais aucun lien sur des domaines qui auraient pu être à l'origine du probleme, mais j'imagine que si un malveillant est passé par là, il aura certainement éviter de laisser des traces en laissant les liens sur son domaine...

A mon avis, retrouver l'auteur, c'est chercher une aiguille dans une botte de foin ! Mais on arrive sur l'un des problemes majeurs actuels des moteurs et de leur définition de "spamindexing" : n'importe qui peut aujourd'hui, avec fourberie et malhonnéteté, faire du spamindexing sur un site qui ne lui appartient pas, et le site en question a ses yeux pour pleurer, subit les conséquences et n'a aucun retour rapide et efficace auprès des moteurs (et je pense essentiellement à google) pour rétablir une situation normale. Bref, ça devient un véritable outil de sabotage industriel et comme il y aura toujours des gens malhonnête...

Probleme : Page bidon indexée chez google, malveillance ?

Formation recommandée sur ce thème :

Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :

Consultez la description détaillée des produits ou services de Google suivants : Google Sitemaps

  • Indice de densité
    Cet outil vous permet de calculer l'indice de densité d'un mot-clé d'une page web. Il est calculé à la fois pour la balise TITLE, la balise META description et l'ensemble du texte de la page.
  • Analyseur d'entête HTTP
    Cet outil vous permet de connaître le code HTTP renvoyé par le serveur pour une page donnée.


Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 1 invité