Google charcute mes url :s

Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics

Galdon
WRInaute discret
WRInaute discret
 
Messages: 79
Inscription: 19 Déc 2007

Google charcute mes url :s

Message le Mer Déc 19, 2007 18:46

Bonjour, je rencontre un probléme d'indexation avec google (mon site est nouveau).
Google enregistre des url qui n'existent pas, il en coupe un morceau pour étre plus précis.

Mon site est composé de cours et de tutoriaux, voici la structure des url:
cours: www.finalclap.com/cours/nom_du_cours.html
tutoriaux: www.finalclap.com/tutoriaux/nom_du_tuto.html

autres pages: www.finalclap.com/nom_de_la_page.html

site:www.finalclap.com

Pour quelques tutoriaux, par exemple celui ci: http://www.finalclap.com/tutoriaux/AfterFX-vecteur.html
Google enregistre ceci dans son index: http://www.finalclap.com/AfterFX-vecteur.html

Mais les resultats varient selon le serveur de recherche: parfois l'url est correct, parfois non

Voici le contenu du .htaccess (je pense que cela pourrait venir de l'url rewritting):
Code: Tout sélectionner
RewriteEngine on

RewriteRule ^tutoriaux/+([0-9a-zA-Z-]+).html$ /index.php?page=tutoriaux/$1 [L]
RewriteRule ^cours/+([0-9a-zA-Z-]+).html$ /index.php?page=cours/$1 [L]

RewriteRule ^([0-9a-zA-Z-]+).html$ /index.php?page=$1 [L]


D'où vient le probléme ?
Merci pour votre aide.

Koxin-L
WRInaute passionné
WRInaute passionné
 
Messages: 1925
Inscription: 29 Mar 2007

Message le Mer Déc 19, 2007 19:25

http://www.finalclap.com/AfterFX-vecteur.html
HTTP Status Code: HTTP/1.1 200 OK

Donc, pour GG la page existe, même si elle est presque vide. Il va donc la garder dans son index.

Première choses, mettre un code 404 sur les url inexistante
Deuxièmement, GG n'inventant rien, ces url il les trouve forcément quelque part.

Galdon
WRInaute discret
WRInaute discret
 
Messages: 79
Inscription: 19 Déc 2007

Message le Mer Déc 19, 2007 20:11

Je ne sais pas ou GG a trouvé cette adresse, je ne l'ai commuiniqué nulle part, on verra bien si ca se reproduit.

Sinon pour le 404, je ne suis pas sur de savoir comment faire.
Si la page existe, c'est parce même si le paramétre de l'include n'est pas correct (page inexstante), la page est quand même généré par php, et par conséquent, la page existe.

Si c'est bien ca, alors il faut que je modifie mon script d'include: quand la page n'existe pas, faire un header 404 ?


UsagiYojimbo
WRInaute accro
WRInaute accro
 
Messages: 8575
Inscription: 23 Nov 2005

Message le Mer Déc 19, 2007 20:19

Galdon a écrit:Je ne sais pas ou GG a trouvé cette adresse, je ne l'ai commuiniqué nulle part, on verra bien si ca se reproduit.

Sinon pour le 404, je ne suis pas sur de savoir comment faire.
Si la page existe, c'est parce même si le paramétre de l'include n'est pas correct (page inexstante), la page est quand même généré par php, et par conséquent, la page existe.

Si c'est bien ca, alors il faut que je modifie mon script d'include: quand la page n'existe pas, faire un header 404 ?


Tu peux essayer de passer Xenu Link Sleuth sur ton site afin de faire le tour des url que tu génères, peux-être à tu laissé passer certaines choses...

Koxin-L
WRInaute passionné
WRInaute passionné
 
Messages: 1925
Inscription: 29 Mar 2007

Message le Mer Déc 19, 2007 22:00

Galdon a écrit:Sinon pour le 404, je ne suis pas sur de savoir comment faire.
Si la page existe, c'est parce même si le paramétre de l'include n'est pas correct (page inexstante), la page est quand même généré par php, et par conséquent, la page existe.

Si c'est bien ca, alors il faut que je modifie mon script d'include: quand la page n'existe pas, faire un header 404 ?


Ex. : http://www.an-2500.org/actualite-113-Ma ... ienne.html

Ajoute une lettre dans l'url...

http://web-sniffer.net/ te permet de tester ton url, ici, une des miennes fausses donne HTTP Status Code: HTTP/1.1 404 Not Found

Comment faire ?

Ma méthode :
Avant l'affichage de la page, je test l'url.
Si elle est erronée
Code: Tout sélectionner
{
header("HTTP/1.0 404 Not Found", false, 404);
include("./404.php");
exit();
}


Tu peux aussi faire une redirection 301 si c'est juste une erreur de caractère.
Perso, je préfère le 404 qui permet dans mes stat de voir les urls erronées qui ont été demandées.

Galdon
WRInaute discret
WRInaute discret
 
Messages: 79
Inscription: 19 Déc 2007

Message le Mer Déc 19, 2007 22:13

Merci beaucoup pour les astuces.
J'ai résolu mes 2 problèmes, en fait les url erronés, c'est a cause du sitemap.xml, je l'avais fait avant d'héberger mon site, je n’avais pas pensé à vérifier depuis, mais c'est bon, le problème est corrigé.

Kijer
WRInaute discret
WRInaute discret
 
Messages: 133
Inscription: 9 Sep 2006

Message le Mer Déc 19, 2007 23:17

De "nourrir" google de 404 n'est pas nocif pour la "qualité" de son site ?

Je m'etais déjà posé la question et je savais pas si c'était préférable qu'il y est x pages "cette page n'existe pas" en status 200 donc duplicate content et laissez google supprimé en douceur toute ses pages.

Koxin-L
WRInaute passionné
WRInaute passionné
 
Messages: 1925
Inscription: 29 Mar 2007

Message le Mer Déc 19, 2007 23:22

Kijer a écrit:De "nourrir" google de 404 n'est pas nocif pour la "qualité" de son site ?

Non, sinon j'en fait 100 000 sur mes concurrents.

Toujours extrapoler en prenant le coté obscure. Si on peut le faire, GG n'en tient pas compte. :wink:


Si vous avez aimé cette discussion, partagez-la sur vos réseaux sociaux préférés :

Formation recommandée sur ce thème :

Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités