Test T6.1 : indexation URL en PHP - extension de fichier

WRInaute discret
idéalement, il faut donner une extension classique mais on peut avoir des pages référencées sans extension

attention aux urls exotiques et aux parametres (pas plus de 2, idéalement)
tu peux utiliser le rewriting pour mettre une url plus litéraire
 
A
Anonymous
Guest
Qu'est-ce que vous appelez une page sans extension ?
Pour reprendre l'exemple donné : http://www.xxx.fr/page, pour moi ça donne l'adresse d'un répertoire et seulement indirectement l'adresse d'une page si le serveur a été configuré pour afficher une page par défaut.
Si c'est de ça que vous parlez, je ne vois pas où est le problème, Googlebot sera automatiquement renvoyé vers la page par défaut. D'après mon expérience perso, c'est tout à fait transparent et ça ne pénalise pas du tout le référencement.
 
WRInaute passionné
Bonjour,

je suis sûr de ce que j'avance pour l'avoir testé.

Je pars d'un site en PHP où tous les liens pointent sur des URL avec extension du style "page.php" : ces pages sont toutes référencées par google. Il n'y a aucune page HTML ( aucun fichier en .htm ni .html ).

Ensuite je vire toutes les extensions .php de mes scripts PHP sur le site, et dans les liens bien sûr. Quand je tape "page" en URL dans mon navigateur ( anciennement "page.php" ), il l'affiche bien. Mais quelques jours plus tard toutes les pages avaient disparu de l'index de google sauf la page d'accueil ( liens externes sur la racine de mon site contenant index.php ).

J'ai remis les extensions .php partout, quelques jours plus tard toutes les pages étaient à nouveau dans l'index de google.

J'en conclu que googlebot ne sait pas lire des URL / fichiers sans extension ( s'il s'agit de script PHP ).
 
WRInaute discret
J'ai seulement donné un exemple.

Mais de toute facon, pour moi, un fichier doit avoir une extension classique pour un meilleur referencement.
 
A
Anonymous
Guest
Dans l'exemple que tu donnes :

http://www.emarketing.fr/V2/Archives.ns ... enDocument

je pense qu'il s'agit en fait d'URL rewriting, la partie "wa/911ECA668B8A370FC1256A1F00382BD0?OpenDocument" doit correspondre à des arguments passés à la page "Archives.nsf".

Pour ce que dit Eservice, est-ce que ce n'est pas la fonction d'auto-complétion (je crois que c'est comme ça que ça s'appelle) et/ou le cache de ton navigateur qui faisaient que les pages étaient visibles pour toi mais pas pour le robot ?
Quand je fais le test chez mon hébergeur (OVH) en supprimant l'extension d'un fichier (.php), ce qui est visible ensuite ensuite dans Explorer c'est tout simplement le contenu du fichier, c'est-à-dire en l'occurrence le script PHP, ce qui n'est pas très recommandé en terme de sécurité !
 
WRInaute discret
effectivement, ce n'est pas top

moi si je mets
Code:
<?php echo include(http://www.athletissimo.net/html/tartan2001.php); ?>
dans une page autre que php cela marche

mais apparament tous les serveurs ne sont pas confuiguré comme cela
 
A
Anonymous
Guest
Ton serveur doit être configuré pour tout prendre comme du PHP, ça n'est pas dur à mettre en place en revanche ça veut dire qu'on utilise parfois les ressources du serveur pour rien : pour les pages où il n'y a pas de PHP mais qui sont quand même inspectées.
 
A
Anonymous
Guest
Eservice : en cherchant sur google pour "html4 site:w3.org", on trouve dans les résultats des pages avec des noms de fichier sans extension mélangées avec des pages dont les fichiers ont leur extension.

On distingue un fichier sans extension d'un dossier grâce au dernier caractère :
http://www.monserveur.com/blabla/ (affiche la page par défaut du dossier blabla)
http://www.monserveur.com/blabla (affiche le fichier nommé blabla)

Remarques :
1) si on utilise la négociation de contenu (comme le site du W3C) ou l'url rewriting, ou une autre technique tels que les alias dans la configuration apache, le nom réel du fichier peut être différent
2) L'extension de fichier est une notion typique à Windows : nii les systèmes Unix/Linux ni les Macintosh n'ont besoin d'extension à leurs fichiers.

Plus d'infos ici :
http://www.w3.org/Provider/Style/URI.html

Jocelyn[/u]
 
A
Anonymous
Guest
Extensions

Vous êtes en train de confondre plusieurs choses. D'abord les serveurs sont des machines "UNIX" et sous UNIX il n'y a pas d'extension de fichiers. Ou en tout cas, elles ne servent pas vraiement, et on peut avoir des fichiers avec des noms complétement anormaux pour des systèmes tels que Mac OS ou Windows. Exemple le fichier .htacces qui est un fichier sans nom, avec une grande extension.
Donc quand on veut savoir si on a affaire à un dossier un un fichier, on demande au système et c'est lui qui le dit.
Ensuite, se pose le problème de l'extension, dans le cadre des langages côté serveur: en fait, quand je demande toto.php l'extension est importante car c'est elle qui permet à Apache de savoir qu'il doit faire passer ce fichier par le moteur. Mais c'est un réglage par défaut, tout comme le fait que la page défaut d'un répertoire se nomme index.html
Mais on peut changer tout cela: on peut décider que ce seront les fichiers ".grtfsstgg" qui seront passés dans le PHP et que ce soit le fichier "juheg.kkijauhdh" qui soit le fichier par défaut d'un répertoire. Comment?
Facile: Apache, PHP, etc. ont des fichiers de config. Mais ces fichiers de config sont "court-circuitables" par les ".htaccess". Si dans un répertoire il y a un htaccess, hop Apache le charge et prend les paramètres qu'il y trouve, au détriment de ces réglages d'origines. Vous pouvez donc avoir "ftr.jhy" par défaut dans un répertoire et "index.ht" dans un autre, faire des redirections automatique, interdire l'accés à un groupe d'IP etc. simplement en modifiant vios htaccess. Mais bon je dois avouer que la littérature sur le format de ce fichier est assez "flou" ou en tout cas souvent incomplétes donc prévoir beaucoup d'aspirine et du café!

PL Lamballais / pl.lamballais@parx.net
 
Nouveau WRInaute
pkoa faire de l'url rewritting a tout prix?

la generation en des pages me semble la meilleur solution, surtout couplé avec les services d'un site comme webcron.org.

on a un meilleur referencement du fait d'un nom de fichier sans parametre, la regeneration toute les 24 H automatique ou a la main si c necesasire de temps en temps, te la decharge du serveur mysql et est quand même le maillon le plus faible de la chaine apache-php-mysql
 
Discussions similaires
Haut