Mon boss s'impatiente ! Pb de méthode ou erreurs majeures ?

Nouveau WRInaute
Bonjour,

J'ai mis en ligne il y a plus d'un mois la v2 du site de la boite pour laquelle je bosse.

L'adresse du site -http://www.superbonplan.com

L'ancienne version était "bien" référencée. Je précise que le référencement n'est pas vraiment ma partie. J'essaie de faire les choses proprement ;-)

Infos tech de base :

- PHP/MySQL
- XHTML strict
- balises méta courantes
- récupération des keywords et description de l'ancienne version
- url_rewriting
- système de cache permettant la génération [ physique ] complète des pages en .html Les pages sont stochées dans un dossier html/ situé à la racine du site. Ex : -http://www.superbonplan.com appelle -http://www.superbonplan.com/index.php qui va générer index.html et le stockage se fait ici -> -http://www.superbonplan.com/html/index.html
- sitemap régénéré automatiquement tous les jours (*) -http://www.superbonplan.com/superbonplan_sitemap.xml.gz
- site vérifié par google avec le tag meta à la mode imposé
- état du plan sitemap -> ok
- le robot googlebot passe de temps en temps ( 21 juin dernier par ex )

Les problèmes :

- Aucune des nouvelles pages n'est indexée sur google
- Seules les anciennes pages ( qui n'existent plus ) sont indexées

Les questions :

- MSN a indexé plus de 300 nouvelles pages. Google non ! Y'a-t-il un problème dans ma méthode ou des erreurs majeures dans mon code ?
- * Notre achitecture repose sur 3 serveurs. L'internaute est dirigé vers l'un ou l'autre en fonction de la charge des autres. J'ai donc un cache, le dossier html/ différent sur chaque serveur en fonction de la navigation des internautes et du serveur sur lequel ils ont été dirigés. Le sitemap est donc régénéré tous les jours sur chaque serveur. Je le renvoie chaque matin ( un au hasard ) à google et il est toujours ok au bout de quelques minutes. En fonction du serveur, le sitemap associé compte entre 2400 et 2800 URL. L'architecture technique exposée ci-dessus peut-elle poser un problème ?

Je ne sais plus trop quoi faire et j'aimerais être bien sûr que les options prises sont bonnes et ne nuisent pas à l'indexation des pages.

J'ai essayé d'être le plus complet et le plus clair possible.

Merci d'avance pour vos commentaires.

A+

Didier
 
WRInaute accro
Quelle est la logique qui a été mise en place pour indiquer la disparition des anciennes pages?

- 404
ou
- 301/302 ?

PS: Il vous faut 3 serveurs en load balancing pour faire tourner ce site :?:
 
Nouveau WRInaute
Bonjour,


HawkEye a dit:
Quelle est la logique qui a été mise en place pour indiquer la disparition des anciennes pages?

- 404
ou
- 301/302 ?
HTTP/1.1 301 Moved Permanently
puis
Location: -http://www.superbonplan.com


HawkEye a dit:
PS: Il vous faut 3 serveurs en load balancing pour faire tourner ce site :?:

:lol: Pas exactement. Nous avons deux autres sites qui tournent sur ces serveurs. Beaucoup de membres, beaucoup de trafic, beaucoup de calcul de stat etc ...

Ceci explique cela. Efectivement superbonplan ne nécessite pas à lui seul ce "confort" qui semble se justifier par ailleurs.

Sinon, tu as remarqué des erreurs grossières qui justifieraient que google boude nos nouvelles pages ?

A+

Didier

Edit : j'ai ajouté un '-' devant l'url puisque cela a été fait dans mon post d'origine
 
WRInaute discret
est ce que les anciennes pages ont des nouvelles pages equivalentes? Ci c le cas fait plutot un 301 des anciennes pages vers les nvelles plutot que vers la racine du domaine
 
WRInaute occasionnel
Google est très lent ces derniers temps...et malheureusement , ca il va falloir le faire comprendre à ton boss...
 
WRInaute passionné
Toutou-Fr a dit:
Google est très lent ces derniers temps...et malheureusement , ca il va falloir le faire comprendre à ton boss...

Une explication simple précise et claire pour un patron

Tu peux éventuellement expliqué à ton boss que Google indexe les nouvelles pages aussi vite qu'il te donne des augmentations. :p
 
Nouveau WRInaute
Bonjour,

medium69 a dit:
Toutou-Fr a dit:
Google est très lent ces derniers temps...et malheureusement , ca il va falloir le faire comprendre à ton boss...
Une explication simple précise et claire pour un patron
Tu peux éventuellement expliqué à ton boss que Google indexe les nouvelles pages aussi vite qu'il te donne des augmentations. :p

:mrgreen: :mrgreen: :mrgreen: :mrgreen: :mrgreen:

Merci pour l'ensemble de vos réponses.

D'après ce que j'ai lu ici ou la, le mauvais référencement peut être du à la lenteur de google et à la "faiblesse" du contenu. J'en déduis que je n'ai pas fait d'erreur majeure ! C'est bien cela ? Ou ce genre d'info ne se "donne" pas ?

A+

Didier
 
WRInaute passionné
le_gber a dit:
est ce que les anciennes pages ont des nouvelles pages equivalentes? Ci c le cas fait plutot un 301 des anciennes pages vers les nvelles plutot que vers la racine du domaine

Idem.
Fais les redirections vers des pages équivalentes.
Ca passe de manière transparente.
La google voit que toutes tes anciennes pages sont assimillées à une page. Donc tous les liens pointant vers les anciennes ne compte que pour ta page d'accueil.
Tu perds donc le positionnement de tes pages secondaires grace aux ancres des liens.
De plus google doit repartir de zéro = 1 porte d'entrée (avec d'un coup plein de nouveaux liens qui pointent vers la meme page) et pas de lien externe vers tes pages internes. C'est dangereux.

Si tu fais une 301 vers les pages équivalentes, tu as conserve pour chaque page interne des éventuels liens externes -> beaucoup plus facile de les référencer. Tu donnes plusieurs portes d'entrée à google.
 
Nouveau WRInaute
Bonjour,

Ok je vais faire tout ça ! Ensuite on laisse passer un peu de temps et on verra bien !

Bon WE.

Didier

PS : Allez France :D
 
Nouveau WRInaute
Salut !

Je viens de parcourir en diagonale :oops: le post qui s'intitule Le tiret gagne le match Tiret contre Underscore. Il s'en dégage que le tiret (-) est préférable à l'underscore (_) en matière d'url rewriting.

J'avais pris soin d'étudier la méthode utilisée par kelkoo et leguide qui utilisent majoritairement l'underscore et qui sont plutôt bien référencés. J'ai donc fait pareil :? et ai choisi l'underscore.

Mes questions :

- comment expliquer le référencement de ces deux sites alors qu'ils n'utilisent pas le tiret ?

- le remplacement des _ par des - dans les urls du site sur lequel je bosse peut-il être franchement bénéfique ? Je devine vos réponses ...

A+

Didier
 
WRInaute occasionnel
Le tiret n'a rien à voir avec l'indexation.

1. Google indexe des pages (peu importe leur forme),
2. A partir des données récupérées sur chaque page, Google génère une valeur pour tout un tas de critères (pour chaque critère),
3. Les critères sont utilisés dans un calcul (le grand algo) pour définir quels résultats vont sortir pour une expression et surtout dans quel ordre il vont apparaître.

Quand au tiret, on a vu que c'était un séparateur. En gros les mots composant l'URL sont pris séparemments, comme deux mots différents, pouvant éventuellement composer une combinaison de mots clefs.
Mettre un tiret a sans doute l'avantage de donner à Google un critère de classement supplémentaire, mais ce n'est pas la solution ultime à tous vos problèmes (puisque d'autres y arrivent sans ça...).
 
WRInaute passionné
didgar a dit:
Salut !

Suede a dit:
Les ancres des liens sont importantes aussi et pour kelkoo, c'est bien fait

Quitte à passer pour une quiche, c'est quoi les ancres des liens ?

A+

Didier


C'est comme pour les bateaux ; c'est pour éviter que les liens aillent navigué n'importe où dans la page.

Hein ? ah oui... :arrow:
 
WRInaute discret
didgar a dit:
Salut !

Suede a dit:
Les ancres des liens sont importantes aussi et pour kelkoo, c'est bien fait

Quitte à passer pour une quiche, c'est quoi les ancres des liens ?

A+

Didier

pour moi c le texte que tu utilise pour lier les pages entre elles - au lieu de dire - pour plus d'info <a>cliquer ici</a>, tu fais Visitez nos <a>mots-cles</a> pour plus d'info.
 
Nouveau WRInaute
Bonjour,

La suite de mes aventures :D

Je suis en train de modifier mon htaccess pour rediriger les anciennes pages ( celle tjs référencées par GG ) vers les nouvelles. Voici un ex :

RewriteRule ^news.html$ /html/toutes_les_news.html [L]

Le pb : comment, au passage, indiquer que news.html n'existe plus ?
Avant, je faisais un 301 Moved Permanently générique redirigé vers l'index du site. La je ne sais pas quelle syntaxe utiliser et surtout dans quel ordre.

Merci de votre patience 8)

A+

Didier
 
WRInaute passionné
La ton news.html existe. Si je ne me trompe, tu fais juste afficher le contenu de /html/toutes_les_news.html quand tu appelles news.html sans rediriger l'adresse.
Si je me trompe pas :

RewriteRule ^news.html$ /html/toutes_les_news.html[QSA,R=301]

QSA fait suivre une eventuel chaine de parametre
 
Nouveau WRInaute
didgar a dit:
Suede a dit:
RewriteRule ^news.html$ /html/toutes_les_news.html[QSA,R=301]

QSA fait suivre une eventuel chaine de parametre

Génial ! Merci !

A+

Didier

Tout s'est bien passé pour les url du genre de ci-dessus ! Par contre pour des url + "fines" c'est plus chaud ;-)

RewriteRule ^\?page\=gagnezargent$ /html/argent.html [QSA,R=301] ne fonctionne pas par ex.

En fait ce qui me manque, c'est un bon tuto qui explique quand mettre un \, à quoi sert le [L] ou autre etc ...

Je vais voir ça ! Si quelqu'un connait un tuto adéquat !

A+

Didier
 
Nouveau WRInaute
Salut !

Merci pour le lien !

Rappel :
url de départ -> monsite.com/?page=gagnezargent
url souhaitée -> monsite.com/html/argent.html
pour essayer -> page.php?rub=argent sachant que la page page.php existe et que la rub argent donne un vrai résultat.

J'ai essayé ça :

rewritecond %{query_string} ^page=gagnezargent$
rewriterule page.php?rub=argent [L]

ça ne fonctionne pas ! Si je rajoute le '?' devant page= la c'est le feu d'artifice ;-)

Si j'ajoute un \ devant le . de page.php ça ne fonctionne pas non plus.

Bref, je galère à bloc !

Une soluce ?

A+
Didier
 
WRInaute passionné
Tu oublies de dire d'ou tu redirifes


url de départ -> monsite.com/?page=gagnezargent
url souhaitée -> monsite.com/html/argent.html



Essaye cela (je ne suis pas sur que ca marche)
Code:
rewritecond %{query_string} ^page=gagnezargent$
rewriterule (.*)$ /html/argent.html [R=301,L]
 
Nouveau WRInaute
Salut !

Et merci pour ton aide !

Suede a dit:
Essaye cela (je ne suis pas sur que ca marche)
Code:
rewritecond %{query_string} ^page=gagnezargent$
rewriterule (.*)$ /html/argent.html [R=301,L]

Ca marche ........ presque !
En effet, l'url devient monsite.com/html/argent.html?page=gagnezargent et le ?page=gagnezargent après le .html fait planter le serveur :?

Pfffff j'en ai marre ! Existe-t-il un livre qui décrit les techniques d'url rewriting que je me le commande tout de suite ?

A+

Didier
 
WRInaute occasionnel
Avec un ? après le .html pour éviter la transmission des paramètres
Code:
rewritecond %{query_string} ^page=gagnezargent$
rewriterule .* /html/argent.html? [R=301,L]
et éventuellement une condition supplémentaire pour limiter les redirections, par exemple
Code:
rewritecond %{REQUEST_URI} !\.html$
rewritecond %{query_string} ^page=gagnezargent$
rewriterule .* /html/argent.html? [R=301,L]
Il y a les docs Apache
http://httpd.apache.org/docs/2.0/misc/rewriteguide.html
http://httpd.apache.org/docs/2.0/mod/mod_rewrite.html
 
Nouveau WRInaute
Salut !

nikoshr a dit:
Avec un ? après le .html pour éviter la transmission des paramètres
Code:
rewritecond %{query_string} ^page=gagnezargent$
rewriterule .* /html/argent.html? [R=301,L]

Soit béni ! Ca fonctionne parfaitement !

nikoshr a dit:

Merci pour ces liens ! J'avais déjà http://httpd.apache.org/docs/1.3/mod/mod_rewrite.html. Je vais en avoir besoin puisque j'ai encore quelques autres url à ré-écrire/rediriger.

Encore merci à tous.

A+

Didier
 
Discussions similaires
Haut