évènement très louche sur mon site perso

Consultez la formation à Google Analytics de WebRankInfo / Ranking Metrics


freetopien
WRInaute passionné
WRInaute passionné
 
Messages: 942
Inscription: Dim Aoû 27, 2006 11:50

évènement très louche sur mon site perso

Message le Dim Sep 07, 2008 15:12

Bonjour,

Voilà l'histoire :
Je créé une nouvelle série d'articles sur mon site avec des fichiers en dur sur mon site en free.fr (pas d'utilisation de BDD) du genre http://monwebsitez.free.fr/cinema/video.php ainsi que http://monwebsitez.free.fr/cinema/video/film1.php, http://monwebsitez.free.fr/cinema/video/film2.php
etc...

Google indexe en 2 jours cette série mais les désindexe le lendemain (sans vraiment m'inquieter, c'est les aléas de google me dis-je), un petit tour sur robotstats pour m'apercevoir qu'il essayait de crawlé http://monwebsitez.free.fr/cinema/video ... /film3.php et des dizaines d'URL du même genre, des URL qui n'existent pas (j'ai vérifié sur mon FTP) & liés de nul part (faîte moi confiance) mais je viens seulement de m'apercevoir aujourd'hui qu'ils renvoyaient des codes 200 OK !!! Je surf dessus & toutes ces pages sont une copie parfaite de http://monwebsitez.free.fr/cinema/video.php

Voilà, questions,
1. comment Google a pu trouver ces pages linkés de nul part & qui n'existe pas dans mon FTP (mais qui renvois un code 200 :?)
2. A la limite Google je m'en fiche, c'est surtout comment ces URL peuvent exister alors que c'est tout simplement impossible...

Super louche non ?
Quelque chose d'énorme a dû m'échapper mais je ne vois pas !!!
Merci de m'aider !


YoyoS
WRInaute accro
WRInaute accro
 
Messages: 3062
Inscription: Jeu Sep 14, 2006 4:53

Message le Dim Sep 07, 2008 15:37

sans l'url, encore une fois, ça va être très dur -_-


freetopien
WRInaute passionné
WRInaute passionné
 
Messages: 942
Inscription: Dim Aoû 27, 2006 11:50

Message le Dim Sep 07, 2008 15:45

ok, c'est moche mais c'est perso donc mais on rigole pas :mrgreen:

ça c'est l'original qui a été désindexé : http://freetopia.free.fr/cinema/bandes- ... -films.php

Les URLS qui existent (mais pas vraiment) (exemples)
xhttp://freetopia.free.fr/cinema/bandes ... ristal.php
Tu mets n'importe quoi après xhttp://freetopia.free.fr/cinema/bandes-annonces-films/ et ça marche.
Preuve que ce n'est pas possible : http://freetopia.free.fr/cinema/


(j'ai ajouté un x devant les pages inculpées pour éviter que google indexe ces bêtises)

eric-joomla
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 190
Inscription: Lun Sep 25, 2006 14:42

Message le Lun Sep 08, 2008 9:36

je n'ai pas tout compris
:)


raljx
WRInaute accro
WRInaute accro
 
Messages: 2253
Inscription: Lun Juil 10, 2006 16:46

Message le Lun Sep 08, 2008 9:51

eric-joomla a écrit:je n'ai pas tout compris
:)


Google lui indexe des pages qui n'existent pas ...

Ce qui est bizarre c'est que des pages comme : xhttp://freetopia.free.fr/cinema/bandes ... ristal.php ne sont pas en 404.

Tu as des regles d'URL Rewriting dans un htaccess ?

eric-joomla
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 190
Inscription: Lun Sep 25, 2006 14:42

Message le Lun Sep 08, 2008 9:56

le HtAccess est une bonne piste

tu n'aurais pas écrit des articles qui ne serait pas publiés ou quelque chose scomme cela
c'est bizzare ton
truc

la page que tu cites existe bel et bien pourtant


freetopien
WRInaute passionné
WRInaute passionné
 
Messages: 942
Inscription: Dim Aoû 27, 2006 11:50

Message le Lun Sep 08, 2008 11:47

raljx a écrit:Google lui indexe des pages qui n'existent pas ...

Pour être exact, elles répondent 200 OK et s'affichent, mais les fichiers et les répertoires N'EXISTENT PAS.

raljx a écrit:Ce qui est bizarre c'est que des pages comme : xhttp://freetopia.free.fr/cinema/bandes ... ristal.php ne sont pas en 404.

Tu as des regles d'URL Rewriting dans un htaccess ?

Free ne supporte même pas l'URL rewriting...
Et je n'ai pas placé d'htaccess sur mon site.



eric-joomla a écrit:tu n'aurais pas écrit des articles qui ne serait pas publiés ou quelque chose scomme cela
c'est bizzare ton
truc

la page que tu cites existe bel et bien pourtant

Elle apparait mais regarde si tu mate la racine de xhttp://freetopia.free.fr/cinema/bandes ... ristal.php c'est à dire http://freetopia.free.fr/cinema le répertoire /cinema/bandes-annonces-films/ n'existe pas.... :?


raljx
WRInaute accro
WRInaute accro
 
Messages: 2253
Inscription: Lun Juil 10, 2006 16:46

Message le Lun Sep 08, 2008 11:56

Lorsque tu tapes : -http://freetopia.free.fr/cinema/bandes-annonces-films/sdfsdf/gdfgds c'est a dire n'importe quoi apres l'url d'une page qui existe cela fonctionne :8

et tu as bien un header à 200 OK

Date: Mon, 08 Sep 2008 10:55:39 GMT
Server: Apache/ProXad [Aug 9 2008 02:45:09]
X-Powered-By: PHP/4.4.3-dev
Connection: close
Content-Type: text/html

200 OK

Le code est perso ?


freetopien
WRInaute passionné
WRInaute passionné
 
Messages: 942
Inscription: Dim Aoû 27, 2006 11:50

Message le Lun Sep 08, 2008 13:28

heu non ?
Enfin c'est moi qui le dis car ça marche, d'un point de vue technique je ne sais pas si il est à 200, une chose est certaine, c'est qu'il n'y a pas 404...
http://www.webrankinfo.com/outils/faq_8_61.htm ?


Leonick
WRInaute accro
WRInaute accro
 
Messages: 12373
Inscription: Dim Aoû 08, 2004 20:24

Message le Lun Sep 08, 2008 17:59

dans ton htaccess, si tu as une réécriture, il ne faut pas utiliser (.*) mais ([^/]*) ce qui fera que tu ne pourras pas avoir plus de sous répertoires virtuels que nécessaire.


freetopien
WRInaute passionné
WRInaute passionné
 
Messages: 942
Inscription: Dim Aoû 27, 2006 11:50

Message le Mar Sep 09, 2008 15:07

J'ai dis ci-dessus que je n'utilise pas d'url rewriting (blocage de free), ni d'htaccess...

Je sais que quelque chose de très bizarre mais personne n'a la moindre idée ?


Bool
WRInaute accro
WRInaute accro
 
Messages: 1290
Inscription: Jeu Fév 26, 2004 15:59

Message le Mar Sep 09, 2008 15:26

Hello,

il n'y a rien "d'anormal" à ça....

Le fait qu'en mettant /film1/ on tombe sur /film1.php est normal, c'est le module mod_negotiation d'Apache qui gère ça.

Ensuite le fait que /film1.php/n-importe/quoi-derriere/ fonctionne est également "normal". Je crois que ça a toujours été le cas, non ?

Tu combines ces deux fonctionnalités et tu comprends pourquoi /film1/film2/film3.php fonctionne parfaitement.

Maintenant pourquoi Google index ça ? C'est "simple" : imagine que sur la page film1.php tu mettes simplement un lien vers film2.php au lieu de /film2.php ; si Google a accédé à la page grace à l'adresse /film1/ il traduit automatiquement le lien par /film1/film2.php.
Donc toujours rien d'anormal ; et aucunement besoin de la moindre ré-écriture.

Le seul soucis à la limite c'est pourquoi a t-il commencé à accédé à une adresse telle que /film1/ ? Il ne l'a certainement pas inventé, il y a forcément eu un lien foireux quelque part.


freetopien
WRInaute passionné
WRInaute passionné
 
Messages: 942
Inscription: Dim Aoû 27, 2006 11:50

Message le Jeu Sep 11, 2008 10:19

re !
Bool a écrit:Hello,

il n'y a rien "d'anormal" à ça....

Le fait qu'en mettant /film1/ on tombe sur /film1.php est normal, c'est le module mod_negotiation d'Apache qui gère ça.

Ensuite le fait que /film1.php/n-importe/quoi-derriere/ fonctionne est également "normal". Je crois que ça a toujours été le cas, non ?

Tu combines ces deux fonctionnalités et tu comprends pourquoi /film1/film2/film3.php fonctionne parfaitement.

Ah oui tout à fait, tu as raison, j'ai testé avec d'autres fichiers/repertoires de mon site, c'est curieux, je ne savais pas !

Bool a écrit:Maintenant pourquoi Google index ça ? C'est "simple" : imagine que sur la page film1.php tu mettes simplement un lien vers film2.php au lieu de /film2.php ; si Google a accédé à la page grace à l'adresse /film1/ il traduit automatiquement le lien par /film1/film2.php.
Donc toujours rien d'anormal ; et aucunement besoin de la moindre ré-écriture.

Le seul soucis à la limite c'est pourquoi a t-il commencé à accédé à une adresse telle que /film1/ ? Il ne l'a certainement pas inventé, il y a forcément eu un lien foireux quelque part.

Pour l'instant (encore aujourd'hui), il ne fait que crawlé, il a ré indexé les "bonnes" URL, j'espère ne pas voir apparaitre les "fausses" dans les SERPS : Risque de duplicate content maximal sinon !

Je suis à la recherche des liens faussés (je n'ai que quelques pages), rien trouvé pour l'instant... :(

Merci à toi pour l'info et à tout le monde d'avoir essayé de m'aider ! :P


raljx
WRInaute accro
WRInaute accro
 
Messages: 2253
Inscription: Lun Juil 10, 2006 16:46

Message le Jeu Sep 11, 2008 12:52

il est fort ce bool quand meme ;)
au fait c'est activé par defaut ce mod_negociation ?


laurentg25
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 214
Inscription: Jeu Sep 22, 2005 21:38

Message le Jeu Sep 11, 2008 13:22

J'ai exactement le même problème que toi, sur une seule page, avec un de mes sites.
J'ai une url qui est du style :
http://www.example.com/test/150-mon-titre-titre2.html
elle a été indexé en :
http://www.example.com/test/150-mon-titre-.....html

La page existe puisque mon script identifie l'ID de la page (le "150") et renvoie un "200 OK" mais l'url qui a été indexé avec les "...." n'est nul par sur mon site ni sur un site externe.


Je viens de faire une redirection 301 de la mauvaise url vers la bonne...wait and see ;)


Formation recommandée sur ce thème :

Formation Google Analytics : en 2 jours, apprenez comment exploiter l'essentiel des possibilités de l'outil de mesure d'audience de Google. Formation animée par Julien Coquet, expert certifié officiellement par Google Analytics.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités