Modification de page source, quels risques ?
17 messages • Page 1 sur 2 • 1, 2
Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics
Modification de page source, quels risques ?
titre absurde, meta tags à profusion, le createur du site (qui a fait faillite depuis) a fait ça n'importe comment.
j'ai donc décidé de changer tout ça moi même... Mais si je change brutalement le titre et si je supprime la plus part des meta tags, cela ne va-t-il pas dérouter les routeurs?
Alain
J'ai une question un peu dans la lignée d'Alain. Depuis le 10 janvier, j'ai changé tout mon site, qui était très mal référencé sur Google et autres pour de multiples raisons. Depuis, j'ai mis un index.php tout à fait potable, pour tous les moteurs de recherche : il inclue le tag NOFRAME, car c'est un site avec FRAMES. Google l'a bien mis à jour dans son cache ( http://www.google.fr/search?q=cache:WxS ... nelle.net/ ) car on peut voir que les liens sont de la forme "robot_xxxx.html". Ce qui est bizarre, c'est qu'il passe pratiquement chaque jour sur le site avec le Fresh Bot, mais il ne suit pas les liens... Et je pense que ça pourrait venir des autres liens (ceux dans les tags FRAMESET) qui change chaque fois qu'on appelle la page (c'est l'identifiant en fait, sous la forme : "identifiant_page.html"). C'est là que je rejoins Alain sur le fait que ma page change tout le temps... Vu que les liens n'arrêtent pas d'être modifiés...
Alors est-ce que ce refus de visite de Google (les autres moteurs s'amusant comme des petits fous : Fast, Inktomi, Voila...) vient du fait que la page change, ou simplement faut-il que j'attende la prochaine GD, après quoi il commencera à suivre les liens ?
Yvan.
Alors est-ce que ce refus de visite de Google (les autres moteurs s'amusant comme des petits fous : Fast, Inktomi, Voila...) vient du fait que la page change, ou simplement faut-il que j'attende la prochaine GD, après quoi il commencera à suivre les liens ?
Yvan.
Je veux bien foncer, c'est d'ailleurs ce que j'ai fait avec cette nouvelle version spéciale moteurs de recherche, mais ça ne me dit pas si Google va correctement me référencer mes pages... Est-il plus intelligent de mettre sur ma page index.php les liens sous la forme :
Autre chose : Google n'a jamais suivi les liens des tags FRAMESET, enfin il s'est toujours arrêté à ces pages là, sans jamais suivre les liens que ces pages des FRAMES contenaient. Pour mon problème d'identifiant changeant tout le temps, j'ai utilisé une technique, c'est de mettre dans le tag NOFRAME des liens avec un ID spécial : "ID=robot". Ce qui fait que seuls les moteurs de recherche accèdent au site par cette porte-là. Inktomi ou Fast ont adoré ces liens (aucun référencement des autres pages avec un identifiant changeant tout le temps). C'est en fait une 'faille' des moteurs : ils ne suivent pas les liens que je montre réellement à mes visiteurs (donc ceux des FRAMESET). Vous voyez le problème ? Personnellement, le site est identique que ce soit un robot ou un visiteur mais pour les gens mal intentionnés, il se trouve que Google, même quand il se fait passer pour IE 5 ou équivalent, voit toujours la même page, vu que je ne vérifie pas le HTTP_USER_AGENT ou autre REMOTE_HOST. En clair je peux faire 2 sites différents pour les moteurs de recherches et pour mes internautes sans me faire blacklister pour cloaking... Et je pense que c'est une faille que Google trouvera bientôt, surtout si on le leur dit... Mais perso je n'ai pas d'autre idée pour pouvoir référencer correctement mon site... Si vous en avez ?
Yvan.
- Code: Tout sélectionner
href="test.php?ID=abcdef"
- Code: Tout sélectionner
href="abcdef_test.html"
Autre chose : Google n'a jamais suivi les liens des tags FRAMESET, enfin il s'est toujours arrêté à ces pages là, sans jamais suivre les liens que ces pages des FRAMES contenaient. Pour mon problème d'identifiant changeant tout le temps, j'ai utilisé une technique, c'est de mettre dans le tag NOFRAME des liens avec un ID spécial : "ID=robot". Ce qui fait que seuls les moteurs de recherche accèdent au site par cette porte-là. Inktomi ou Fast ont adoré ces liens (aucun référencement des autres pages avec un identifiant changeant tout le temps). C'est en fait une 'faille' des moteurs : ils ne suivent pas les liens que je montre réellement à mes visiteurs (donc ceux des FRAMESET). Vous voyez le problème ? Personnellement, le site est identique que ce soit un robot ou un visiteur mais pour les gens mal intentionnés, il se trouve que Google, même quand il se fait passer pour IE 5 ou équivalent, voit toujours la même page, vu que je ne vérifie pas le HTTP_USER_AGENT ou autre REMOTE_HOST. En clair je peux faire 2 sites différents pour les moteurs de recherches et pour mes internautes sans me faire blacklister pour cloaking... Et je pense que c'est une faille que Google trouvera bientôt, surtout si on le leur dit... Mais perso je n'ai pas d'autre idée pour pouvoir référencer correctement mon site... Si vous en avez ?
Yvan.
-

WebRankInfo - Administrateur du site

- Messages: 15905
- Inscription: Ven Avr 19, 2002 19:51
quand Google parle de cloaking, ma petite idée est qu'ils connaissent ça mieux que 99,9% d'entre nous... enfin ce n'est que mon avis.
sinon ton problème ne vient pas des frames je pense, mais comme tu le dis de ces identifiants de session. Google n'indexera pas les pages ayant des identifiants, pour une raison compréhensible : il trouvera des URL différentes à chaque visite, ce qui est fort déroutant.
essaie de trouver une solution sans identifiants passés dans les URL. sinon fais un plan du site avec des liens vers chaque page, sans identifiant de session.
sinon ton problème ne vient pas des frames je pense, mais comme tu le dis de ces identifiants de session. Google n'indexera pas les pages ayant des identifiants, pour une raison compréhensible : il trouvera des URL différentes à chaque visite, ce qui est fort déroutant.
essaie de trouver une solution sans identifiants passés dans les URL. sinon fais un plan du site avec des liens vers chaque page, sans identifiant de session.
Tu as très certainement raison Olivier, il est clair que les ingénieurs de chez Google doivent penser à tout. Et c'est peut-être pour ça que GoogleBot ne veut pas aller plus loin. Je m'explique un peu plus, code source à l'appui, parce que j'ai pas dû être très clair et je m'en excuse.
Voilà un extrait de mon index.php :
Toutes les pages sont retraitées par l'URL Rewriting d'Apache, donc "xxx_yyy.html" devient "main.php?action=yyy&ID=xxx", ID était l'identifiant de session.
Donc on peut voir 4 URLs utilisant l'identifiant "iu796c", qui s'afficheront dans les frames. En bas, on a les liens pour les moteurs de recherche : l'identifiant est "robot". Ainsi je conserve l'identifiant "robot" pour les moteurs de recherche lorsqu'ils parcourent mes pages, de sorte que les pages soient toujours identiques. Cependant l'index.php change à chaque fois, vu que l'identifiant "iu796c" sera modifié au prochain appel de la page. Donc est-ce que le fait que ce bout de code source change à chaque fois peut gêner Google ? Sachant que les autre moteurs n'ont eu aucun souci jusqu'à présent. Je ne me fais pas trop de soucis pour le moments (j'ai mesexams qui arrivent en plus !), et je me dis qu'après la GD ça devrait partir, mais je n'en ai aucune certitude...
Yvan, qui fait des choses que personne ne ferait pour se faire bien voir du "Dieu" Google.
Voilà un extrait de mon index.php :
- Code: Tout sélectionner
<HTML>
<HEAD>
<TITLE>.: La Coccinelle du Net :. Quand traduction rime avec chanson .: Lyrics :: Paroles :: Traductions :: Chansons :.</TITLE>
</HEAD>
<FRAMESET cols="*" rows="60,30,*,30" border="0" frameborder="NO">
<FRAME name="title" noresize scrolling="NO" src="iu796c_top.html">
<FRAME name="middle" noresize scrolling="NO" src="iu796c_middle.html">
<FRAME name="main" noresize scrolling="AUTO" src="iu796c_main.html">
<FRAME name="bottom" noresize scrolling="NO" src="iu796c_bottom.html">
</FRAMESET>
<NOFRAME>
<BODY bgcolor="black" text="orange">
Plan du site pour les moteurs de recherche :<BR>
<A href="robot_main.html">Page d'accueil</A><BR>
<A href="robot_last20.html">Les 20 dernières chansons</A><BR>
<A href="robot_search.html">Page de recherche</A><BR>
<A href="robot_link.html">Page de liens</A><BR>
<A href="robot_topten.html">Page du top 20</A><BR>
</BODY>
</NOFRAME>
</HTML>
Toutes les pages sont retraitées par l'URL Rewriting d'Apache, donc "xxx_yyy.html" devient "main.php?action=yyy&ID=xxx", ID était l'identifiant de session.
Donc on peut voir 4 URLs utilisant l'identifiant "iu796c", qui s'afficheront dans les frames. En bas, on a les liens pour les moteurs de recherche : l'identifiant est "robot". Ainsi je conserve l'identifiant "robot" pour les moteurs de recherche lorsqu'ils parcourent mes pages, de sorte que les pages soient toujours identiques. Cependant l'index.php change à chaque fois, vu que l'identifiant "iu796c" sera modifié au prochain appel de la page. Donc est-ce que le fait que ce bout de code source change à chaque fois peut gêner Google ? Sachant que les autre moteurs n'ont eu aucun souci jusqu'à présent. Je ne me fais pas trop de soucis pour le moments (j'ai mesexams qui arrivent en plus !), et je me dis qu'après la GD ça devrait partir, mais je n'en ai aucune certitude...
Yvan, qui fait des choses que personne ne ferait pour se faire bien voir du "Dieu" Google.
J'ai une solution pour que google prenne quelques pages en plus.
Les sessions ne s'ajoute à l'url que site le lien est page.html mais pas h**p://www.site.com/pages.html
IL te suffit donc de modifier tes links en ajoutant l'url de ton site devant.
Les sessions ne s'ajoute à l'url que site le lien est page.html mais pas h**p://www.site.com/pages.html
IL te suffit donc de modifier tes links en ajoutant l'url de ton site devant.
Décidément je suis pas assez clair... Faudrait que je consulte un jour...
Alors : l'identifiant de session est le mien, pas celui des sessions de PHP. En effet j'ai eu beaucoup de problèmes avec les sessions de PHP, qui par exemple perdaient toutes les infos au bout de 30 min par exemple. Et ça c'est pas cool... De plus j'avais pas trop la main là-dessus, donc j'ai fait mon propre système de session (et oui, c'est peut-être idiot, mais bon je voyais pas d'autre alternative...).
Donc j'ai besoin d'initialiser une session sur mon index.php, pour que mes frames soient toutes de la même couleur (y'a en effet 4 apparences, donc ça va pas le faire si je mets pas les mêmes couleurs sur les 4 frames). Et c'est là que j'utilise mon identifiant de session. Ce que je veux faire, c'est ne pas utiliser de cookies, car ils ne sont pas forcément toujours activés. Alors que mes liens ont toujours l'identifiant de session OK.
Donc, à moins que je trouve une autre solution pour faire passer l'identifiant, je ne vois pas comment garder l'identifiant... A moins de mettre une page d'accueil au tout début, sans frames ni rien. Et ensuite de faire des liens pour Google à partir de cette page "propre".
Et donc ma question était de savoir si un lien du type "page.php?id=xxxx" est mieux pour Google qu'un "xxxx_page.html" car il a peut-être l'impression que la page ne change pas même si l'identifiant change ??? Enfin c'est pas très clair je sais.
Yvan.
Alors : l'identifiant de session est le mien, pas celui des sessions de PHP. En effet j'ai eu beaucoup de problèmes avec les sessions de PHP, qui par exemple perdaient toutes les infos au bout de 30 min par exemple. Et ça c'est pas cool... De plus j'avais pas trop la main là-dessus, donc j'ai fait mon propre système de session (et oui, c'est peut-être idiot, mais bon je voyais pas d'autre alternative...).
Donc j'ai besoin d'initialiser une session sur mon index.php, pour que mes frames soient toutes de la même couleur (y'a en effet 4 apparences, donc ça va pas le faire si je mets pas les mêmes couleurs sur les 4 frames). Et c'est là que j'utilise mon identifiant de session. Ce que je veux faire, c'est ne pas utiliser de cookies, car ils ne sont pas forcément toujours activés. Alors que mes liens ont toujours l'identifiant de session OK.
Donc, à moins que je trouve une autre solution pour faire passer l'identifiant, je ne vois pas comment garder l'identifiant... A moins de mettre une page d'accueil au tout début, sans frames ni rien. Et ensuite de faire des liens pour Google à partir de cette page "propre".
Et donc ma question était de savoir si un lien du type "page.php?id=xxxx" est mieux pour Google qu'un "xxxx_page.html" car il a peut-être l'impression que la page ne change pas même si l'identifiant change ??? Enfin c'est pas très clair je sais.
Yvan.
Oki, je vois ce que tu veux dire.
Le truc c'est que j'ai fait exprès de faire des liens du type "robot_page.html" ("robot_main.html", "robot_links.html", ...), dont l'URL ne change donc jamais. Ces liens se trouvent dans les tags NOFRAME. Le fait est que tous les moteurs suivent ces liens (statiques), mais Google non. Donc je me demande s'il y a lieu de m'inquiéter ou si Google suivra ces liens sans broncher, sachant que la page est sans arrêt différente dans la partie haute où sont définies les FRAMES. Donc dois-je attendre la GD ?
Yvan.
Le truc c'est que j'ai fait exprès de faire des liens du type "robot_page.html" ("robot_main.html", "robot_links.html", ...), dont l'URL ne change donc jamais. Ces liens se trouvent dans les tags NOFRAME. Le fait est que tous les moteurs suivent ces liens (statiques), mais Google non. Donc je me demande s'il y a lieu de m'inquiéter ou si Google suivra ces liens sans broncher, sachant que la page est sans arrêt différente dans la partie haute où sont définies les FRAMES. Donc dois-je attendre la GD ?
Yvan.
-

WebRankInfo - Administrateur du site

- Messages: 15905
- Inscription: Ven Avr 19, 2002 19:51
questions naïves : as-tu réellement besoin des frames ? cela changerait-il le problème ?
Disons que les FRAMES me sauvent la vie. Mis à part le fait qu'elles permettent de limiter la taille des pages (pas besoin de recharger le menu etc...), elles ont surtout l'avantage de pouvoir rediriger Google sur un identifiant choisi (en l'occurrence ID="robot").
En effet, j'attribue un identifiant différent à chacun de mes visiteurs, leur permettant ainsi de voyager sur le site avec une sorte d'identification comme avec les sessions de PHP en stockant l'apparence du site, leur pseudo... Et qui s'efface 2 h après qu'ils soient partis, sauf pour les membres.
Par exemple : si vous aviez plusieurs apparences ("skin") sur WRI, comment feriez-vous pour toujours garder la même ? Et donc conserver des données d'une page à l'autre ? Ou comment identifier de manière unique un utilisateur (donc on peut oublier l'IP et autre HTTP_USER_AGENT) ?
J'ai peut-être trouvé une solution : Faire une page d'accueil en plus, sur laquelle Google trouverait toute l'architecture du site sans identifiant et surtout avec un code source toujours identique. Puis un lien vers mon actuel "index.php", qui lui changerait tout le temps, à cause de l'identifiant.
Je sais que c'est compliqué, et peut-être il y a plus simple, mais je ne vois pas.
Merci de votre aide !
Yvan.
En effet, j'attribue un identifiant différent à chacun de mes visiteurs, leur permettant ainsi de voyager sur le site avec une sorte d'identification comme avec les sessions de PHP en stockant l'apparence du site, leur pseudo... Et qui s'efface 2 h après qu'ils soient partis, sauf pour les membres.
Par exemple : si vous aviez plusieurs apparences ("skin") sur WRI, comment feriez-vous pour toujours garder la même ? Et donc conserver des données d'une page à l'autre ? Ou comment identifier de manière unique un utilisateur (donc on peut oublier l'IP et autre HTTP_USER_AGENT) ?
J'ai peut-être trouvé une solution : Faire une page d'accueil en plus, sur laquelle Google trouverait toute l'architecture du site sans identifiant et surtout avec un code source toujours identique. Puis un lien vers mon actuel "index.php", qui lui changerait tout le temps, à cause de l'identifiant.
Je sais que c'est compliqué, et peut-être il y a plus simple, mais je ne vois pas.
Merci de votre aide !
Yvan.
Yvan,
Tu es sûr de ton URL rewriting?
Lorsque je fais un clic droit sur ton "top 20" pour ouvrir la page dans une nouvelle fenêtre j'ai une page avec l'URL suivante (je la coupe en 2 pour ne pas faire trop large):
Ce n'est pas tout à fait ce que j'appellerais une URL "propre", non ?
Je sais, le clic droit est vicieux mais c'était pour voir si tu rechargeais correctement le frameset
Dan
Tu es sûr de ton URL rewriting?
Lorsque je fais un clic droit sur ton "top 20" pour ouvrir la page dans une nouvelle fenêtre j'ai une page avec l'URL suivante (je la coupe en 2 pour ne pas faire trop large):
- Code: Tout sélectionner
http://www.lacoccinelle.net/index.php?ID=xqf87z&action=topten&song_id=&query=
&artist_id=&letter=&HTTP_REFERER=http://www.lacoccinelle.net/5ekxfu_main.html
Ce n'est pas tout à fait ce que j'appellerais une URL "propre", non ?
Je sais, le clic droit est vicieux mais c'était pour voir si tu rechargeais correctement le frameset
Dan
17 messages • Page 1 sur 2 • 1, 2
Formation recommandée sur ce thème :
Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Modification de vos sites dans l'annuaire
- Sortie officielle de GoogleStats v2.0 !
- La toolbar pour Firefox de Google
- Formation Droit et Internet : enjeux juridiques d'un site web
- Les enjeux juridiques du Web 2.0 : quelques réflexions...
- Prospectus d'entrée en bourse de Google
- Changement d'algorithme Google : nom de code Dewey
- Google rachète Neven Vision
- Lancement de Spider Simulator
- Changements dans l'algorithme de Yahoo (sept 2007)
- quels sont les risques si risques il ya ???
- enfin le code source du vista publié, bientot en open source
- [Google] Code source d'Androïd devient Open Source
- Les risques ?
- .fr acheté identique à .com : risques
- register_globals ON or OFF : les risques
- google analytics et risques
- Risques de SandBox ? Prime Fraicheur ?
- le .net sans le .com quels risques?
- risques quand transfert de serveur ?
- Refaire son site, quels risques?
- Risques quand divulgation d'informations bancaires
- risques liés à la création d'une newsletter
- Url multiples et risques de duplicate content
- Redirection 302 by OVH : les risques ?
Consultez la description détaillée des produits ou services de Google suivants : Google Code : Open Source Projects
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités






le forum