Modification de page source, quels risques ?

Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics

allain13
Nouveau WRInaute
 
Messages: 19
Inscription: Lun Jan 13, 2003 17:10

Modification de page source, quels risques ?

Message le Dim Jan 19, 2003 15:52

:? lorsque je vais sur la page source de mon site: -www.amako.fr j' y trouve beaucoup de défauts si j'en crois les infos lues sur webrankinfos:
titre absurde, meta tags à profusion, le createur du site (qui a fait faillite depuis) a fait ça n'importe comment.
j'ai donc décidé de changer tout ça moi même... Mais si je change brutalement le titre et si je supprime la plus part des meta tags, cela ne va-t-il pas dérouter les routeurs?

Alain

Mitirapa
WRInaute accro
WRInaute accro
 
Messages: 1649
Inscription: Mer Juil 10, 2002 17:36

Message le Dim Jan 19, 2003 16:13

vas y fonce !


hetzeld
WRInaute accro
WRInaute accro
 
Messages: 2209
Inscription: Lun Déc 02, 2002 18:21

Message le Dim Jan 19, 2003 17:57

Salut Alain,

Tu ne risques rien du tout. Tant que ta page garde le même nom (de fichier), elle sera toujours trouvable.
Tu peux changer tout ce qui te semble nécessaire à l'intérieur de la page.

Dan


Yvan
WRInaute impliqué
WRInaute impliqué
 
Messages: 279
Inscription: Mer Nov 06, 2002 8:30

Message le Dim Jan 19, 2003 21:51

J'ai une question un peu dans la lignée d'Alain. Depuis le 10 janvier, j'ai changé tout mon site, qui était très mal référencé sur Google et autres pour de multiples raisons. Depuis, j'ai mis un index.php tout à fait potable, pour tous les moteurs de recherche : il inclue le tag NOFRAME, car c'est un site avec FRAMES. Google l'a bien mis à jour dans son cache ( http://www.google.fr/search?q=cache:WxS ... nelle.net/ ) car on peut voir que les liens sont de la forme "robot_xxxx.html". Ce qui est bizarre, c'est qu'il passe pratiquement chaque jour sur le site avec le Fresh Bot, mais il ne suit pas les liens... Et je pense que ça pourrait venir des autres liens (ceux dans les tags FRAMESET) qui change chaque fois qu'on appelle la page (c'est l'identifiant en fait, sous la forme : "identifiant_page.html"). C'est là que je rejoins Alain sur le fait que ma page change tout le temps... Vu que les liens n'arrêtent pas d'être modifiés...
Alors est-ce que ce refus de visite de Google (les autres moteurs s'amusant comme des petits fous : Fast, Inktomi, Voila...) vient du fait que la page change, ou simplement faut-il que j'attende la prochaine GD, après quoi il commencera à suivre les liens ?

Yvan.


dompa
Nouveau WRInaute
 
Messages: 13
Inscription: Mer Déc 18, 2002 19:05

Message le Lun Jan 20, 2003 16:59

pareil fonce: de toute façon avec un referencement aussi mauvais les moteurs sont déjà déroutés :x


Yvan
WRInaute impliqué
WRInaute impliqué
 
Messages: 279
Inscription: Mer Nov 06, 2002 8:30

Message le Lun Jan 20, 2003 20:17

Je veux bien foncer, c'est d'ailleurs ce que j'ai fait avec cette nouvelle version spéciale moteurs de recherche, mais ça ne me dit pas si Google va correctement me référencer mes pages... Est-il plus intelligent de mettre sur ma page index.php les liens sous la forme :
Code: Tout sélectionner
href="test.php?ID=abcdef"
ou sous la forme :
Code: Tout sélectionner
href="abcdef_test.html"
sachant que le "abcdef" change à chaque fois qu'on ouvre la page, puisque c'est un identifiant généré au hasard. Alors, problème ou pas ?

Autre chose : Google n'a jamais suivi les liens des tags FRAMESET, enfin il s'est toujours arrêté à ces pages là, sans jamais suivre les liens que ces pages des FRAMES contenaient. Pour mon problème d'identifiant changeant tout le temps, j'ai utilisé une technique, c'est de mettre dans le tag NOFRAME des liens avec un ID spécial : "ID=robot". Ce qui fait que seuls les moteurs de recherche accèdent au site par cette porte-là. Inktomi ou Fast ont adoré ces liens (aucun référencement des autres pages avec un identifiant changeant tout le temps). C'est en fait une 'faille' des moteurs : ils ne suivent pas les liens que je montre réellement à mes visiteurs (donc ceux des FRAMESET). Vous voyez le problème ? Personnellement, le site est identique que ce soit un robot ou un visiteur mais pour les gens mal intentionnés, il se trouve que Google, même quand il se fait passer pour IE 5 ou équivalent, voit toujours la même page, vu que je ne vérifie pas le HTTP_USER_AGENT ou autre REMOTE_HOST. En clair je peux faire 2 sites différents pour les moteurs de recherches et pour mes internautes sans me faire blacklister pour cloaking... Et je pense que c'est une faille que Google trouvera bientôt, surtout si on le leur dit... Mais perso je n'ai pas d'autre idée pour pouvoir référencer correctement mon site... Si vous en avez ?

Yvan.


WebRankInfo
Administrateur du site
Administrateur du site
 
Messages: 15905
Inscription: Ven Avr 19, 2002 19:51

Message le Lun Jan 20, 2003 22:36

quand Google parle de cloaking, ma petite idée est qu'ils connaissent ça mieux que 99,9% d'entre nous... enfin ce n'est que mon avis.

sinon ton problème ne vient pas des frames je pense, mais comme tu le dis de ces identifiants de session. Google n'indexera pas les pages ayant des identifiants, pour une raison compréhensible : il trouvera des URL différentes à chaque visite, ce qui est fort déroutant.

essaie de trouver une solution sans identifiants passés dans les URL. sinon fais un plan du site avec des liens vers chaque page, sans identifiant de session.


Yvan
WRInaute impliqué
WRInaute impliqué
 
Messages: 279
Inscription: Mer Nov 06, 2002 8:30

Message le Lun Jan 20, 2003 23:10

Tu as très certainement raison Olivier, il est clair que les ingénieurs de chez Google doivent penser à tout. Et c'est peut-être pour ça que GoogleBot ne veut pas aller plus loin. Je m'explique un peu plus, code source à l'appui, parce que j'ai pas dû être très clair et je m'en excuse.
Voilà un extrait de mon index.php :
Code: Tout sélectionner
<HTML>
<HEAD>
<TITLE>.: La Coccinelle du Net :. Quand traduction rime avec chanson .: Lyrics :: Paroles :: Traductions :: Chansons :.</TITLE>
</HEAD>
<FRAMESET cols="*" rows="60,30,*,30" border="0" frameborder="NO">
<FRAME name="title" noresize scrolling="NO" src="iu796c_top.html">
<FRAME name="middle" noresize scrolling="NO" src="iu796c_middle.html">
<FRAME name="main" noresize scrolling="AUTO" src="iu796c_main.html">
<FRAME name="bottom" noresize scrolling="NO" src="iu796c_bottom.html">
</FRAMESET>
<NOFRAME>
<BODY bgcolor="black" text="orange">
  Plan du site pour les moteurs de recherche :<BR>
<A href="robot_main.html">Page d'accueil</A><BR>
<A href="robot_last20.html">Les 20 derni&egrave;res chansons</A><BR>
<A href="robot_search.html">Page de recherche</A><BR>
<A href="robot_link.html">Page de liens</A><BR>
<A href="robot_topten.html">Page du top 20</A><BR>
</BODY>
</NOFRAME>
</HTML>
J'ai enlevé tout ce qui ne servait à rien pour alléger un peu.
Toutes les pages sont retraitées par l'URL Rewriting d'Apache, donc "xxx_yyy.html" devient "main.php?action=yyy&ID=xxx", ID était l'identifiant de session.
Donc on peut voir 4 URLs utilisant l'identifiant "iu796c", qui s'afficheront dans les frames. En bas, on a les liens pour les moteurs de recherche : l'identifiant est "robot". Ainsi je conserve l'identifiant "robot" pour les moteurs de recherche lorsqu'ils parcourent mes pages, de sorte que les pages soient toujours identiques. Cependant l'index.php change à chaque fois, vu que l'identifiant "iu796c" sera modifié au prochain appel de la page. Donc est-ce que le fait que ce bout de code source change à chaque fois peut gêner Google ? Sachant que les autre moteurs n'ont eu aucun souci jusqu'à présent. Je ne me fais pas trop de soucis pour le moments (j'ai mesexams qui arrivent en plus !), et je me dis qu'après la GD ça devrait partir, mais je n'en ai aucune certitude...

Yvan, qui fait des choses que personne ne ferait pour se faire bien voir du "Dieu" Google.


deblok
WRInaute passionné
WRInaute passionné
 
Messages: 583
Inscription: Jeu Oct 17, 2002 21:51

Message le Mar Jan 21, 2003 10:02

J'ai une solution pour que google prenne quelques pages en plus.

Les sessions ne s'ajoute à l'url que site le lien est page.html mais pas h**p://www.site.com/pages.html

IL te suffit donc de modifier tes links en ajoutant l'url de ton site devant.


Yvan
WRInaute impliqué
WRInaute impliqué
 
Messages: 279
Inscription: Mer Nov 06, 2002 8:30

Message le Mar Jan 21, 2003 15:14

Décidément je suis pas assez clair... Faudrait que je consulte un jour...
Alors : l'identifiant de session est le mien, pas celui des sessions de PHP. En effet j'ai eu beaucoup de problèmes avec les sessions de PHP, qui par exemple perdaient toutes les infos au bout de 30 min par exemple. Et ça c'est pas cool... De plus j'avais pas trop la main là-dessus, donc j'ai fait mon propre système de session (et oui, c'est peut-être idiot, mais bon je voyais pas d'autre alternative...).
Donc j'ai besoin d'initialiser une session sur mon index.php, pour que mes frames soient toutes de la même couleur (y'a en effet 4 apparences, donc ça va pas le faire si je mets pas les mêmes couleurs sur les 4 frames). Et c'est là que j'utilise mon identifiant de session. Ce que je veux faire, c'est ne pas utiliser de cookies, car ils ne sont pas forcément toujours activés. Alors que mes liens ont toujours l'identifiant de session OK.
Donc, à moins que je trouve une autre solution pour faire passer l'identifiant, je ne vois pas comment garder l'identifiant... A moins de mettre une page d'accueil au tout début, sans frames ni rien. Et ensuite de faire des liens pour Google à partir de cette page "propre".
Et donc ma question était de savoir si un lien du type "page.php?id=xxxx" est mieux pour Google qu'un "xxxx_page.html" car il a peut-être l'impression que la page ne change pas même si l'identifiant change ??? Enfin c'est pas très clair je sais.

Yvan.


deblok
WRInaute passionné
WRInaute passionné
 
Messages: 583
Inscription: Jeu Oct 17, 2002 21:51

Message le Mar Jan 21, 2003 15:48

C parreil une fois qu'il y a les xxx c pas pris en compte.

Mon astuce avec les liens contenant http:// c t pour que google te prenne en compte quelques pages en plus.


Yvan
WRInaute impliqué
WRInaute impliqué
 
Messages: 279
Inscription: Mer Nov 06, 2002 8:30

Message le Mar Jan 21, 2003 16:01

Oki, je vois ce que tu veux dire.
Le truc c'est que j'ai fait exprès de faire des liens du type "robot_page.html" ("robot_main.html", "robot_links.html", ...), dont l'URL ne change donc jamais. Ces liens se trouvent dans les tags NOFRAME. Le fait est que tous les moteurs suivent ces liens (statiques), mais Google non. Donc je me demande s'il y a lieu de m'inquiéter ou si Google suivra ces liens sans broncher, sachant que la page est sans arrêt différente dans la partie haute où sont définies les FRAMES. Donc dois-je attendre la GD ?

Yvan.


WebRankInfo
Administrateur du site
Administrateur du site
 
Messages: 15905
Inscription: Ven Avr 19, 2002 19:51

Message le Mar Jan 21, 2003 19:03

questions naïves : as-tu réellement besoin des frames ? cela changerait-il le problème ?


Yvan
WRInaute impliqué
WRInaute impliqué
 
Messages: 279
Inscription: Mer Nov 06, 2002 8:30

Message le Mar Jan 21, 2003 20:22

Disons que les FRAMES me sauvent la vie. Mis à part le fait qu'elles permettent de limiter la taille des pages (pas besoin de recharger le menu etc...), elles ont surtout l'avantage de pouvoir rediriger Google sur un identifiant choisi (en l'occurrence ID="robot").
En effet, j'attribue un identifiant différent à chacun de mes visiteurs, leur permettant ainsi de voyager sur le site avec une sorte d'identification comme avec les sessions de PHP en stockant l'apparence du site, leur pseudo... Et qui s'efface 2 h après qu'ils soient partis, sauf pour les membres.
Par exemple : si vous aviez plusieurs apparences ("skin") sur WRI, comment feriez-vous pour toujours garder la même ? Et donc conserver des données d'une page à l'autre ? Ou comment identifier de manière unique un utilisateur (donc on peut oublier l'IP et autre HTTP_USER_AGENT) ?
J'ai peut-être trouvé une solution : Faire une page d'accueil en plus, sur laquelle Google trouverait toute l'architecture du site sans identifiant et surtout avec un code source toujours identique. Puis un lien vers mon actuel "index.php", qui lui changerait tout le temps, à cause de l'identifiant.
Je sais que c'est compliqué, et peut-être il y a plus simple, mais je ne vois pas.
Merci de votre aide !

Yvan.


hetzeld
WRInaute accro
WRInaute accro
 
Messages: 2209
Inscription: Lun Déc 02, 2002 18:21

Message le Mar Jan 21, 2003 21:13

Yvan,

Tu es sûr de ton URL rewriting?
Lorsque je fais un clic droit sur ton "top 20" pour ouvrir la page dans une nouvelle fenêtre j'ai une page avec l'URL suivante (je la coupe en 2 pour ne pas faire trop large):
Code: Tout sélectionner
http://www.lacoccinelle.net/index.php?ID=xqf87z&action=topten&song_id=&query=
&artist_id=&letter=&HTTP_REFERER=http://www.lacoccinelle.net/5ekxfu_main.html

Ce n'est pas tout à fait ce que j'appellerais une URL "propre", non ? :lol:

Je sais, le clic droit est vicieux mais c'était pour voir si tu rechargeais correctement le frameset :oops:

Dan

Modification de page source, quels risques ?

Formation recommandée sur ce thème :

Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités