Test T6.1 : indexation URL en PHP - extension de fichier
13 messages • Page 1 sur 1
Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics
Test T6.1 : indexation URL en PHP - extension de fichier
Bonjour,
j'ai testé le cas d'URL sans extension ( http://www.xxx.fr/page au lieu de http://www.xxx.fr/page.php ). Les liens internes de mon site étaient sans extension et les fichiers HTML correspondants n'existaient pas ( http://www.xxx.fr/page.htm).
Google n'indexe aucune URL sans extension : il faut préciser .php ( ou .htm ou .html s'il s'agit de langage HTML ).
j'ai testé le cas d'URL sans extension ( http://www.xxx.fr/page au lieu de http://www.xxx.fr/page.php ). Les liens internes de mon site étaient sans extension et les fichiers HTML correspondants n'existaient pas ( http://www.xxx.fr/page.htm).
Google n'indexe aucune URL sans extension : il faut préciser .php ( ou .htm ou .html s'il s'agit de langage HTML ).
Dernière édition par Eservice le Lun Sep 30, 2002 22:21, édité 1 fois.
-

athletissimo - WRInaute occasionnel

- Messages: 126
- Inscription: Mar Aoû 27, 2002 15:55
idéalement, il faut donner une extension classique mais on peut avoir des pages référencées sans extension
attention aux urls exotiques et aux parametres (pas plus de 2, idéalement)
tu peux utiliser le rewriting pour mettre une url plus litéraire
attention aux urls exotiques et aux parametres (pas plus de 2, idéalement)
tu peux utiliser le rewriting pour mettre une url plus litéraire
- Invité
Qu'est-ce que vous appelez une page sans extension ?
Pour reprendre l'exemple donné : http://www.xxx.fr/page, pour moi ça donne l'adresse d'un répertoire et seulement indirectement l'adresse d'une page si le serveur a été configuré pour afficher une page par défaut.
Si c'est de ça que vous parlez, je ne vois pas où est le problème, Googlebot sera automatiquement renvoyé vers la page par défaut. D'après mon expérience perso, c'est tout à fait transparent et ça ne pénalise pas du tout le référencement.
Pour reprendre l'exemple donné : http://www.xxx.fr/page, pour moi ça donne l'adresse d'un répertoire et seulement indirectement l'adresse d'une page si le serveur a été configuré pour afficher une page par défaut.
Si c'est de ça que vous parlez, je ne vois pas où est le problème, Googlebot sera automatiquement renvoyé vers la page par défaut. D'après mon expérience perso, c'est tout à fait transparent et ça ne pénalise pas du tout le référencement.
-

athletissimo - WRInaute occasionnel

- Messages: 126
- Inscription: Mar Aoû 27, 2002 15:55
ok pour moi, le mieux est de mettre un / pour indiquer que l'on se trouve dans un repoertoire et de configurer votre serveur pour qu'il affiche un fichier d'index par défaut
exemple: il vaut mieux mettre www.monsite.com/mon_repertoire/ que www.monsite.com/mon_repertoire
si il indexent des pages sans extensions visibles dans l'url
exemple trouvé :
http://www.emarketing.fr/V2/Archives.ns ... enDocument
exemple: il vaut mieux mettre www.monsite.com/mon_repertoire/ que www.monsite.com/mon_repertoire
si il indexent des pages sans extensions visibles dans l'url
exemple trouvé :
http://www.emarketing.fr/V2/Archives.ns ... enDocument
Bonjour,
je suis sûr de ce que j'avance pour l'avoir testé.
Je pars d'un site en PHP où tous les liens pointent sur des URL avec extension du style "page.php" : ces pages sont toutes référencées par google. Il n'y a aucune page HTML ( aucun fichier en .htm ni .html ).
Ensuite je vire toutes les extensions .php de mes scripts PHP sur le site, et dans les liens bien sûr. Quand je tape "page" en URL dans mon navigateur ( anciennement "page.php" ), il l'affiche bien. Mais quelques jours plus tard toutes les pages avaient disparu de l'index de google sauf la page d'accueil ( liens externes sur la racine de mon site contenant index.php ).
J'ai remis les extensions .php partout, quelques jours plus tard toutes les pages étaient à nouveau dans l'index de google.
J'en conclu que googlebot ne sait pas lire des URL / fichiers sans extension ( s'il s'agit de script PHP ).
je suis sûr de ce que j'avance pour l'avoir testé.
Je pars d'un site en PHP où tous les liens pointent sur des URL avec extension du style "page.php" : ces pages sont toutes référencées par google. Il n'y a aucune page HTML ( aucun fichier en .htm ni .html ).
Ensuite je vire toutes les extensions .php de mes scripts PHP sur le site, et dans les liens bien sûr. Quand je tape "page" en URL dans mon navigateur ( anciennement "page.php" ), il l'affiche bien. Mais quelques jours plus tard toutes les pages avaient disparu de l'index de google sauf la page d'accueil ( liens externes sur la racine de mon site contenant index.php ).
J'ai remis les extensions .php partout, quelques jours plus tard toutes les pages étaient à nouveau dans l'index de google.
J'en conclu que googlebot ne sait pas lire des URL / fichiers sans extension ( s'il s'agit de script PHP ).
-

athletissimo - WRInaute occasionnel

- Messages: 126
- Inscription: Mar Aoû 27, 2002 15:55
J'ai seulement donné un exemple.
Mais de toute facon, pour moi, un fichier doit avoir une extension classique pour un meilleur referencement.
Mais de toute facon, pour moi, un fichier doit avoir une extension classique pour un meilleur referencement.
- Invité
Dans l'exemple que tu donnes :
http://www.emarketing.fr/V2/Archives.ns ... enDocument
je pense qu'il s'agit en fait d'URL rewriting, la partie "wa/911ECA668B8A370FC1256A1F00382BD0?OpenDocument" doit correspondre à des arguments passés à la page "Archives.nsf".
Pour ce que dit Eservice, est-ce que ce n'est pas la fonction d'auto-complétion (je crois que c'est comme ça que ça s'appelle) et/ou le cache de ton navigateur qui faisaient que les pages étaient visibles pour toi mais pas pour le robot ?
Quand je fais le test chez mon hébergeur (OVH) en supprimant l'extension d'un fichier (.php), ce qui est visible ensuite ensuite dans Explorer c'est tout simplement le contenu du fichier, c'est-à-dire en l'occurrence le script PHP, ce qui n'est pas très recommandé en terme de sécurité !
http://www.emarketing.fr/V2/Archives.ns ... enDocument
je pense qu'il s'agit en fait d'URL rewriting, la partie "wa/911ECA668B8A370FC1256A1F00382BD0?OpenDocument" doit correspondre à des arguments passés à la page "Archives.nsf".
Pour ce que dit Eservice, est-ce que ce n'est pas la fonction d'auto-complétion (je crois que c'est comme ça que ça s'appelle) et/ou le cache de ton navigateur qui faisaient que les pages étaient visibles pour toi mais pas pour le robot ?
Quand je fais le test chez mon hébergeur (OVH) en supprimant l'extension d'un fichier (.php), ce qui est visible ensuite ensuite dans Explorer c'est tout simplement le contenu du fichier, c'est-à-dire en l'occurrence le script PHP, ce qui n'est pas très recommandé en terme de sécurité !
-

athletissimo - WRInaute occasionnel

- Messages: 126
- Inscription: Mar Aoû 27, 2002 15:55
effectivement, ce n'est pas top
moi si je mets
mais apparament tous les serveurs ne sont pas confuiguré comme cela
moi si je mets
- Code: Tout sélectionner
<?php echo include(http://www.athletissimo.net/html/tartan2001.php); ?>
mais apparament tous les serveurs ne sont pas confuiguré comme cela
- Invité
Ton serveur doit être configuré pour tout prendre comme du PHP, ça n'est pas dur à mettre en place en revanche ça veut dire qu'on utilise parfois les ressources du serveur pour rien : pour les pages où il n'y a pas de PHP mais qui sont quand même inspectées.
-

athletissimo - WRInaute occasionnel

- Messages: 126
- Inscription: Mar Aoû 27, 2002 15:55
oui mais c'est mieux en sécurité
cela dépent de la capacité de charge du serveur
cela dépent de la capacité de charge du serveur
- Invité
Eservice : en cherchant sur google pour "html4 site:w3.org", on trouve dans les résultats des pages avec des noms de fichier sans extension mélangées avec des pages dont les fichiers ont leur extension.
On distingue un fichier sans extension d'un dossier grâce au dernier caractère :
http://www.monserveur.com/blabla/ (affiche la page par défaut du dossier blabla)
http://www.monserveur.com/blabla (affiche le fichier nommé blabla)
Remarques :
1) si on utilise la négociation de contenu (comme le site du W3C) ou l'url rewriting, ou une autre technique tels que les alias dans la configuration apache, le nom réel du fichier peut être différent
2) L'extension de fichier est une notion typique à Windows : nii les systèmes Unix/Linux ni les Macintosh n'ont besoin d'extension à leurs fichiers.
Plus d'infos ici :
http://www.w3.org/Provider/Style/URI.html
Jocelyn[/u]
On distingue un fichier sans extension d'un dossier grâce au dernier caractère :
http://www.monserveur.com/blabla/ (affiche la page par défaut du dossier blabla)
http://www.monserveur.com/blabla (affiche le fichier nommé blabla)
Remarques :
1) si on utilise la négociation de contenu (comme le site du W3C) ou l'url rewriting, ou une autre technique tels que les alias dans la configuration apache, le nom réel du fichier peut être différent
2) L'extension de fichier est une notion typique à Windows : nii les systèmes Unix/Linux ni les Macintosh n'ont besoin d'extension à leurs fichiers.
Plus d'infos ici :
http://www.w3.org/Provider/Style/URI.html
Jocelyn[/u]
- PL Lamballais
Extensions
Vous êtes en train de confondre plusieurs choses. D'abord les serveurs sont des machines "UNIX" et sous UNIX il n'y a pas d'extension de fichiers. Ou en tout cas, elles ne servent pas vraiement, et on peut avoir des fichiers avec des noms complétement anormaux pour des systèmes tels que Mac OS ou Windows. Exemple le fichier .htacces qui est un fichier sans nom, avec une grande extension.
Donc quand on veut savoir si on a affaire à un dossier un un fichier, on demande au système et c'est lui qui le dit.
Ensuite, se pose le problème de l'extension, dans le cadre des langages côté serveur: en fait, quand je demande toto.php l'extension est importante car c'est elle qui permet à Apache de savoir qu'il doit faire passer ce fichier par le moteur. Mais c'est un réglage par défaut, tout comme le fait que la page défaut d'un répertoire se nomme index.html
Mais on peut changer tout cela: on peut décider que ce seront les fichiers ".grtfsstgg" qui seront passés dans le PHP et que ce soit le fichier "juheg.kkijauhdh" qui soit le fichier par défaut d'un répertoire. Comment?
Facile: Apache, PHP, etc. ont des fichiers de config. Mais ces fichiers de config sont "court-circuitables" par les ".htaccess". Si dans un répertoire il y a un htaccess, hop Apache le charge et prend les paramètres qu'il y trouve, au détriment de ces réglages d'origines. Vous pouvez donc avoir "ftr.jhy" par défaut dans un répertoire et "index.ht" dans un autre, faire des redirections automatique, interdire l'accés à un groupe d'IP etc. simplement en modifiant vios htaccess. Mais bon je dois avouer que la littérature sur le format de ce fichier est assez "flou" ou en tout cas souvent incomplétes donc prévoir beaucoup d'aspirine et du café!
PL Lamballais / pl.lamballais@parx.net
Donc quand on veut savoir si on a affaire à un dossier un un fichier, on demande au système et c'est lui qui le dit.
Ensuite, se pose le problème de l'extension, dans le cadre des langages côté serveur: en fait, quand je demande toto.php l'extension est importante car c'est elle qui permet à Apache de savoir qu'il doit faire passer ce fichier par le moteur. Mais c'est un réglage par défaut, tout comme le fait que la page défaut d'un répertoire se nomme index.html
Mais on peut changer tout cela: on peut décider que ce seront les fichiers ".grtfsstgg" qui seront passés dans le PHP et que ce soit le fichier "juheg.kkijauhdh" qui soit le fichier par défaut d'un répertoire. Comment?
Facile: Apache, PHP, etc. ont des fichiers de config. Mais ces fichiers de config sont "court-circuitables" par les ".htaccess". Si dans un répertoire il y a un htaccess, hop Apache le charge et prend les paramètres qu'il y trouve, au détriment de ces réglages d'origines. Vous pouvez donc avoir "ftr.jhy" par défaut dans un répertoire et "index.ht" dans un autre, faire des redirections automatique, interdire l'accés à un groupe d'IP etc. simplement en modifiant vios htaccess. Mais bon je dois avouer que la littérature sur le format de ce fichier est assez "flou" ou en tout cas souvent incomplétes donc prévoir beaucoup d'aspirine et du café!
PL Lamballais / pl.lamballais@parx.net
pkoa faire de l'url rewritting a tout prix?
la generation en des pages me semble la meilleur solution, surtout couplé avec les services d'un site comme webcron.org.
on a un meilleur referencement du fait d'un nom de fichier sans parametre, la regeneration toute les 24 H automatique ou a la main si c necesasire de temps en temps, te la decharge du serveur mysql et est quand même le maillon le plus faible de la chaine apache-php-mysql
la generation en des pages me semble la meilleur solution, surtout couplé avec les services d'un site comme webcron.org.
on a un meilleur referencement du fait d'un nom de fichier sans parametre, la regeneration toute les 24 H automatique ou a la main si c necesasire de temps en temps, te la decharge du serveur mysql et est quand même le maillon le plus faible de la chaine apache-php-mysql
13 messages • Page 1 sur 1
Formation recommandée sur ce thème :
Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- SEO Links (Extension Firefox)
- Customize Google (extension Firefox)
- Outil de test d'indexation Google + analyse de l'âge d'un site
- Testez AdSense sans même vous inscrire !
- Suite de l'article sur le fichier .htaccess : l'URL rewriting
- Google Dance de mai 2003
- Optimiser les URL pour le référencement
- Optimisation du référencement d'un site en AJAX
- Les moteurs tiennent compte des mots-clés dans les URL
- SEO for Firefox : une extension Firefox pour le référencement
Consultez la description détaillée des produits ou services de Google suivants : Google Browser Sync, Google Send to Phone, Google Co-Op
- Test de redirection
Cet outil vous permet de tester la validité d'un lien pour le référencement. Il vous indique la nature du lien (lien en dur, redirection bien gérée par les moteurs ou redirection mal gérée par les moteurs). - Analyseur d'entête HTTP
Cet outil vous permet de connaître le code HTTP renvoyé par le serveur pour une page donnée. - Test data centers Google
Cet outil vous permet d'afficher sur une seule page les résultats Google effectués sur de nombreux data centers (centres de données).
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités


le forum