Problème de pages en double à cause de index.html

WRInaute discret
Bonjour,

Je viens de voir que GWT me signale tout un tas de balises title en double.
En fait, le problème de ces pages, c'est moi, sûrement, mais aussi "index.html"

Je m'explique :
ces pages sont toutes du type
monsite.com/dossier/index.html et
monsite.com/dossier/

ou encore
monsite.com/dossier/sousdossier/index.html et
monsite.com/dossier/sousdossier/

Comment faut-il faire, ou y a t'il une solution pour que, via le htaccess, toutes les URL du site se terminant par /index.html soient réécrites sans ce index.html ?

Si quelqu'un a la solution, sachant que je suis nul dans ce domaine ... Je suis preneur ...

Merci par avance
 
WRInaute passionné
Fredo73 a dit:
Si quelqu'un a la solution, sachant que je suis nul dans ce domaine ... Je suis preneur ...
Merci par avance
Bonjour Fredo, c'est plutot Google qui est null sur ce genre de double ... ne connaissant pas un seul site qui a une page index default.html et une autre page index.html dans le même repertoire à la fois ...

Si apres plus de 10 ans, les ingénieurs de Google ne savent pas résoudre ce probleme, c'est de la mauvaise volonté.

ca ne pose pas de probleme je crois pour le referencement, a moins que certains ont des tests probants?
 
WRInaute passionné
Ben dans tous les cas, Google n'en choisira qu'une des deux a mettre dans les serps. Après, je ne saurais dire si cela influe sur le fait qu'une url est un répertoire et l'autre une page ...
 
WRInaute accro
J'aurai quand même tendance à penser que plutôt que laisser l'une des deux pages tomber dans l'index complémentaire, mieux faut faire des redirections. Ca ne mange pas de pain, même si en effet on pourrait imaginer que Google soit en mesure de traiter ça comme un grand après toutes ces années.
 
WRInaute accro
faudrait essayer un truc du genre dans le htaccess :

Code:
RewriteCond %{REQUEST_URI} ^(.*)index.html$
RewriteRule (.*)index.html $1 [R=301,L]

J'ai pas testé c'est l'esprit qui compte savoir réécrire toutes les urls finissant par /index.html par leur équivalent sans et renvoyer un 301.
Faut aussi faire disparaitre tous les liens contenant "index.html" car ces urls sont pas arrivé par hasard.
Ensuite tu as les inconditionnel du DC qui flippent dès que le site est accessible via deux urls et tu as les autres qui s'en contrefichent. Perso j'ai un site qui est resté 3/4 ans sans réécriture avec une version www et sans et j'ai jamais constaté de mieux quand j'ai réécrit une des deux versions bref ...
 
WRInaute accro
zeb a dit:
Perso j'ai un site qui est resté 3/4 ans sans réécriture avec une version www et sans et j'ai jamais constaté de mieux quand j'ai réécrit une des deux versions bref ...

Oui mais ça tu peux le gérer via GWT, sans forcément avoir besoin d'une redirection. Et on est quand même à une époque où avec tous les algos qui évoluent vers de plus en plus d'intransigeance, mieux vaut être le plus propre possible au niveau de la construction des sites.
 
WRInaute discret
Merci à vous tous pour vos réponses.

@Zeb
Je vais tester ta proposition pour essayer de ne plus avoir ces doublons

@UsagiYojimbo
J'aurai tendance à te rejoindre sur le fait que, par les temps qui courent, il vaut mieux éviter de tendre le bâton pour se faire battre ...

Je vais essayer de jeter un œil avec le bout de code de Zeb.

Encore merci et bonne soirée.
 
WRInaute accro
UsagiYojimbo a dit:
Oui mais ça tu peux le gérer via GWT, sans forcément avoir besoin d'une redirection.
Oui je me doute, tout comme tu peux ne rien faire et ne jamais avoir de souci si tu n'a pas d'url merdiques qui trainent donc que tu n'est pas crawlé en double. Mais le cas est amusant car il a une certaine valeur de "test". C'est un site que j'ai totalement négligé et même pas géré via GWT et comme dit plus haut aucun changement le jour de la mise a niveau vers un truc plus sérieux. Donc soit GG fait la corrélation tout seul comme un grand soit le DC 100% sur site est une légende urbaine (je penche plutôt pour le point 1 :D ).

Après dans les faits j'abonde totalement dans ton sens tu as raison mieux vaux gérer le problème (vue que ça ne coute rien ou presque) que de se retrouver un jour le bec dans l'eau car c'est devenu "obligatoire".
 
Discussions similaires
Haut