Lettres accentuées et url

WRInaute accro
Salut,

Que pensez-vous des lettres accentuées contenues dans les url ?

Y voyez-vous des inconvénients ou avantages ?
A mon sens, l’internaute lambda y gagne sans conteste en confort.

Cerise sur le gâteau, Google semble très bien s’en accommoder : sur cette requête sans accent, Google affiche en tête de liste une url avec lettre accentuée. Pourtant peu de sites intègrent des lettres accentuées dans leurs url.

Pourquoi selon vous ?

salva.
 
WRInaute accro
jen avais jamais vu avant, ils ont du modifier leur serveur, j'aimerais bien savoir comment zils font ca...
 
WRInaute accro
KOogar a dit:
jen avais jamais vu avant, ils ont du modifier leur serveur, j'aimerais bien savoir comment zils font ca...
Je suis en mesure de le faire également mais j'attends quelques retours.

Côté technique rien d'exceptionnel, script codé en utf8, mysql_5.0.44 Unicode (utf8) et php_5.2.5.
Et les bonnes regex qui vont avec.
 
WRInaute accro
salva a dit:
Pourtant peu de sites intègrent des lettres accentuées dans leurs url.
parce que beaucoup de navigateurs les gèrent mal et je ne parle même pas des scripts de forum qui ont de gros problèmes avec des url comme http://www.example.com/unhérison.htm
Maintenant, tu vois pourquoi on n'utilise pas de caractères accentués quand on veut pouvoir obtenir des BL externes :wink:
 
WRInaute accro
Ton point de vu est recevable mais peut être pas aussi handicapant que tu ne le laisses suggérer. Wikipédia s’en sort très bien.

En fait, je souhaiterais me lancer dans le référencement naturel pour le projet en cours. Et dans la mesure du possible, j’aimerais bien avoir quelques retours concrets.

Pour les autres lecteurs, que pensez-vous du point soulevé par Leonick ou alors, voyez-vous encore d’autres inconvénients ?
 
WRInaute accro
salva a dit:
Je suis en mesure de le faire également mais j'attends quelques retours.

Côté technique rien d'exceptionnel, script codé en utf8, mysql_5.0.44 Unicode (utf8) et php_5.2.5.
Et les bonnes regex qui vont avec.

ya me semble aucun rapport entre l'url et (utf8, sql et php), pour le regex tu parles d'une url rewitée ? de mon coté j'ai essayé et je me prend que des boucles :(
 
WRInaute accro
KOogar a dit:
salva a dit:
Je suis en mesure de le faire également mais j'attends quelques retours.

Côté technique rien d'exceptionnel, script codé en utf8, mysql_5.0.44 Unicode (utf8) et php_5.2.5.
Et les bonnes regex qui vont avec.

ya me semble aucun rapport entre l'url et (utf8, sql et php)
Ben si quand même, l'url rewritée est stockée dans la base et il est impératif que la base utilise un jeu de caractères UTF-8
KOogar a dit:
pour le regex tu parles d'une url rewitée ? de mon coté j'ai essayé et je me prend que des boucles :(
Oui pour l'url rewritée.

J'ai aussi galèré pas mal :) Avec cette classe abrégée \s ça roule tout seul, du moins chez moi.
 
WRInaute accro
ah ok, toi tu parles de la construction de l'url, mais que ca se fasse en iso ou en utf, sérieux c'est pas pour te vexer mais on s'en cale non ?

j'ai fait des tests de mon coté :

sur OVH avec un fichier apélé -http://www..../été.php et ca boucle
sur Online avec un fichier apélé -http://www..../été.php et ca boucle

sur OVH avec un fichier apélé -http://www..../été (donc sans extension) et ca boucle
sur Online avec un fichier apélé -http://www..../été (donc sans extension) et ca FONCTIONNE !!

voila, question de serveur et il faut travailler sans l'extension de fichier.

Si le rewrite est bien fait, que l'on mette /ete ou /été, la redirection peut se faire sur la meme page, donc pour les forums il existe une solution et wiki a aussi ce type de redirection. Pretty kool comme sujet :)
 
WRInaute accro
KOogar a dit:
ah ok, toi tu parles de la construction de l'url, mais que ca se fasse en iso ou en utf, sérieux c'est pas pour te vexer mais on s'en cale non ?
Toi sans doute :D
Perso, si je n'utilise pas utf8, le serveur me renvoie "The requested page has not been found!". Je viens de faire le test avec ASCII, UniCode et iso html.
KOogar a dit:
j'ai fait des tests de mon coté :

sur OVH avec un fichier apélé www/été.php et ca boucle
sur Online avec un fichier apélé www/été.php et ca boucle

sur OVH avec un fichier apélé www/été (donc sans extension) et ca boucle
sur Online avec un fichier apélé www/été (donc sans extension) et ca FONCTIONNE !!

voila, question de serveur, et il faut travailler sans l'extension de fichier.
Effectivement, je n'utilise pas d'extension par contre je suis chez OVH.
KOogar a dit:
Si le rewrite est bien fait, que l'on mette /ete ou /été, la redirection peut se faire sur la meme page, donc pour les forums il existe une solution et wiki a aussi ce type de redirection. Pretty kool comme sujet
Ah, intéressant :)
Et tu t'y prends comment :mrgreen:
 
WRInaute accro
Leonick a dit:
salva a dit:
Pourtant peu de sites intègrent des lettres accentuées dans leurs url.
parce que beaucoup de navigateurs les gèrent mal et je ne parle même pas des scripts de forum qui ont de gros problèmes avec des url comme http://www.example.com/unhérison.htm
Je viens de tester : en conservant l'id devant la chaine rewritée ( /id_unhérison.htm )le lien est suivi.

Ne reste plus qu'à récupérer automatiquement les 404 et les rediriger sur la bonne url.
Enfin quand je dis automatiquement, c'est surtout vite dit :)

Une piste de recherche peut-être ?
 
WRInaute accro
Ce que je tentais de mettre en exergue, ce n'était pas le fait que sur son propre serveur on ne pouvait pas gérer correctement les uri avec caractères accentués, mais surtout que sur des sites tiers, on avait 95% de "chance" que les uri ne soient pas correctement suivies. Et donc création de plein de pages 404, mais les pages intéressantes ne pourront plus avoir leur lien correct sur la quasi totalité des forums, blogs, ...
 
WRInaute accro
J'avais bien compris...Je viens de faire le test sur 3 forums (dont WRI) et les trois liens sont suivis. L'url est tronquée jusqu'au premier accent mais la page s'affiche correctement.
 
WRInaute accro
salva a dit:
J'avais bien compris...Je viens de faire le test sur 3 forums (dont WRI) et les trois liens sont suivis. L'url est tronquée jusqu'au premier accent mais la page s'affiche correctement.
donc duplicate content potentiel entre les sites qui arriveront à écrire correctement les liens des BL et les autres :cry: et puis l'uri va-t-elle être écrite correctement ? le caractère accentué sera-t-il un utf-8 ou en ISO ?
 
WRInaute accro
Leonick a dit:
salva a dit:
J'avais bien compris...Je viens de faire le test sur 3 forums (dont WRI) et les trois liens sont suivis. L'url est tronquée jusqu'au premier accent mais la page s'affiche correctement.
donc duplicate content potentiel entre les sites qui arriveront à écrire correctement les liens des BL et les autres :cry:
D'où la redirection de l'url tronquée sur la bonne.
 
WRInaute accro
salva a dit:
KOogar a dit:
Si le rewrite est bien fait, que l'on mette /ete ou /été, la redirection peut se faire sur la meme page, donc pour les forums il existe une solution et wiki a aussi ce type de redirection. Pretty kool comme sujet
Ah, intéressant :)
Et tu t'y prends comment :mrgreen:

Je voyais une simple réécriture, travailler dans un dossier pour pouvoir avoir un regex "mange tout"
RewriteRule rep/([^/]*) file_caracteres_speciaux.php?name=$1

et une redirection php sur le fichier : file_caracteres_speciaux.php?name=été selon ce que contient $name (été ou ete)

****

Chez OVH je n'arrive pas à créer des fichiers sans extension, tu aurais un exemple de rewrite?
 
WRInaute accro
KOogar a dit:
salva a dit:
KOogar a dit:
Si le rewrite est bien fait, que l'on mette /ete ou /été, la redirection peut se faire sur la meme page, donc pour les forums il existe une solution et wiki a aussi ce type de redirection. Pretty kool comme sujet
Ah, intéressant :)
Et tu t'y prends comment :mrgreen:

Je voyais une simple réécriture, travailler dans un dossier pour pouvoir avoir un regex "mange tout"
RewriteRule rep/([^/]*) file_caracteres_speciaux.php?name=$1

et une redirection php sur le fichier : file_caracteres_speciaux.php?name=été selon ce que contient $name (été ou ete)
Tu créerais un répertoire (avec htaccess) spécifique et unique pour toutes les redirections?

J’avais pensé à une règle unique qui redirigerait en 301 toutes les urls externes demandées. Je m’explique :

En conservant l’id brute en tête de la chaine de caractère à rewriter, tous backlinks ( sur sites, blogs, forum, annuaires,..), tronqués ou non, affichent les pages demandées correctement (l’url tronquée le sera à partir du premier accent rencontré dans l’url mais l’id passera toujours).

Partant de ce constat, en appliquant une redirection systématique de toutes les pages appelées ( depuis un site, blog, forum, annuaire) sur leur identifiant respectif (urls rewritées stockées en BD), mon problème d’url tronquées devrait être résolu ou alors ai-je oublié quelque chose ?
Ne vais-je pas rencontrer un phénomène de boucle infinie sur les backlinks correctement orthographiés ?

Puis comment Google perçoit-il ce type de redirection systématique des backlinks ?

KOogar a dit:
...tu aurais un exemple de rewrite?

Code:
function getLinkCtrl($title="")
{
    if( $this->s->urlRewrtingActif() )
    {
        if( !$title ) $title = $this->getTitle(FALSE);
        $Lienrewrite = "{$this->id}_" . preg_replace("[\s]", "-", strtolower($title));
        if( !$this->s->ommitCatLienrewrite )
        {
            $catLienrewrite = $this->getCatLienrewrite();
            $lienrewrite = "$catLienrewrite/$Lienrewrite";
        }
        $ctrl = new AppController();
        $ctrl->setLienrewrite($Lienrewrite);
    }
    else $ctrl =& new AppController($this->get_class() . "/$this->id");
    return $ctrl;
}
 
WRInaute accro
salva a dit:
Tu créerais un répertoire (avec htaccess) spécifique et unique pour toutes les redirections?

oui, independant du reste du site, cela permet 1 seul regex, j'adore comment a procédé wiki

Pour le php ton code sert a construire une url, j'aurais aimé avoir simplement le rewrite pour rediriger une url sans extension. Ce rewrite avec moi chez OVH ca boucle en 500 :
RewriteRule ^rep/([^/]*)$ /file_caracteres_speciaux.php?name=$1


Leonick a dit:
Et concrètement, c'est quoi l'intérêt ?

cha par exemple => http://fr.wikipedia.org/wiki/Pel%C3%A9
 
WRInaute accro
KOogar a dit:
Pour le php ton code sert a construire une url, j'aurais aimé avoir simplement le rewrite pour rediriger une url sans extension. Ce rewrite avec moi chez OVH ca boucle en 500 :
RewriteRule ^rep/([^/]*)$ /file_caracteres_speciaux.php?name=$1
Je ne suis pas sûr d'être sur la même longeur d'onde que toi :) mais le script formate les urls sans extension, je n’ai pas ce souci, sorry.
Si ça peut t'aider voici les règles du htaccess
Code:
<IfModule mod_rewrite.c>
    Options -MultiViews
    RewriteEngine on
    RewriteCond %{HTTP_HOST} !^www\.ndd\.fr [NC]
    RewriteRule (.*) http://www.ndd.fr/$1 [QSA,R=301,L]
    RewriteRule .* - [env=REWRITE_ON]
    RewriteCond %{REQUEST_FILENAME} !-d
    RewriteCond %{REQUEST_FILENAME} !-f 
    RewriteCond %{REQUEST_FILENAME} !\.(js|css|png|jpg|gif)$
    RewriteRule ^(.*)$ index.php?url=$1 [L]
</IfModule>
Leonick a dit:
Et concrètement, c'est quoi l'intérêt ? :roll:
Pour que ce type de lien http://www.example.com/id_unhérison.htm arrive à bon port sans duplicate.

Ps j'ai complété mon post précédent
 
WRInaute accro
merci pour le code (oui oui ca m'aide)

@Leonick
et comme cela c'est ok ?
Pelé sur wiki

c'est forcement interressant pour certain sites de garder les accents dans l'url. et ca ne doit pas etre grand chose de patcher phpbb pour qu'il accepte les accents. Je ne vois pas pourquoi nous devrions souffrir des normes étrangères. Les accents existent et sont indispensable.

l'url qui tue : /famille/pepe-et-meme.html ....n'a aucun sens dans la langue de Molière
 
WRInaute accro
KOogar a dit:
@Leonick
et comme cela c'est ok ?
Pelé sur wiki
sauf que si je fais un copier/coller de l'url dans la barre d'adresse de FF, ça me donne http://fr.wikipedia.org/wiki/Pel%C3%A9, si je veux créer un bookmark, ça me donne la même chose.
Je veux envoyer le lien par mel, en avec le menu Fichier/... encore le même problème sous FF et IE pareil
Donc je ne vois toujours pas l'intérêt, surtout que le poids des mots clés dans l'uri (y compris le ndd) est très faible chez gg
 
Discussions similaires
Haut