Problème avec mon fichier sitemap.xml

WRInaute occasionnel
Bonjour,

Je pense que la création d'un fichier sitemap.xml est primordiale pour un bon référencement.

Personnellement j'ai généré le mien avec www.xml-sitemaps.com et je trouve que c'est un outil super !

Par contre j'ai un petit souci, car en premières url il a généré www.france-immoplus.fr et www.france-immoplus.fr/index.htm

J'ai peur que ça fasse "doublon" , aussi j'ai enlevé la deuxième url et je n'ai laissé dans mon fichier sitemap.xml que la première ( www.france-immoplus.fr/ ) !

Ai-je eu raison ? En fait aurait-il mieux valu laisser la deuxième ( www.france-immoplus.fr/index.htm ) ? Fallait-il laisser les deux ? Quelqu'un pourrait-il, svp, répondre à ces questions !

Autrement, si vous voulez voir mon fichier il est ici : http://www.france-immoplus.fr/sitemap.xml

Pourriez-vous me dire s'il est correct au niveau "priorités" et "période de renouvellement" ?

Merci d'avance à tous ceux qui voudront bien m'aider.

Cordialement.
 
WRInaute occasionnel
Bonjour detectimmobilier,

Je suis là grâce à vous... J'avais entendu parler du forum WRI mais je ne m'y étais pas inscrit.

J'espère trouver de l'aide ici et aussi en apporter avec mes modestes moyens aux autres membres.

Cordialement.
 
WRInaute passionné
fabricus a dit:
Bonjour detectimmobilier,

Je suis là grâce à vous... J'avais entendu parler du forum WRI mais je ne m'y étais pas inscrit.

J'espère trouver de l'aide ici et aussi en apporter avec mes modestes moyens aux autres membres.

Cordialement.

Le madribot ne va pas tarder à indexer ce post et apporter son savoir et son pot d'accueil à moins qu'il ait pris son week end :wink:
Il y a plein d'experts compétents sur ce forum, on reçoit et on donne ensuite en fonction de l'acquisition des compétences (houla ça me rappelle trop ma vie antérieure ce terme)
 
WRInaute occasionnel
Rebonjour detectimmobilier,

[quote="detectimmobilier]
Le madribot ne va pas tarder à indexer ce post et apporter son savoir et son pot d'accueil à moins qu'il ait pris son week end :wink:
Il y a plein d'experts compétents sur ce forum, on reçoit et on donne ensuite en fonction de l'acquisition des compétences (houla ça me rappelle trop ma vie antérieure ce terme)
[/quote]

Je ne doute pas de la grande expérience des membres de ce forum, à côté je dois être un débutant, mais je ferais de mon mieux pour apporter ma pierre à l'édifice.

J'attends avec impatience une réponse à mon problème.

Cordialement.
 
WRInaute passionné
fabricus a dit:
Rebonjour detectimmobilier,

Je ne doute pas de la grande expérience des membres de ce forum, à côté je dois être un débutant, mais je ferais de mon mieux pour apporter ma pierre à l'édifice.

J'attends avec impatience une réponse à mon problème.

Cordialement.

On est tous le débutant de quelqu'un :wink:
M'étonne qu'il ne soit pas encore passé, doit avoir trop de cadeaux à livrer :wink:
 
WRInaute accro
fabricus a dit:

Itou

fabricus a dit:
Je pense que la création d'un fichier sitemap.xml est primordiale pour un bon référencement.

Euh pas vraiment. Ce qui est primordial c'est d'avoir une bonne structure de site, bien optimisée et facile à crawler. Si il y a des problèmes d'indexation, c'est là qu'il faut se tourner en premier, pas vers le sitemap.
De plus le sitemap favorise le crawl, mais il n'a aucun impact sur le positionnement (et donc sur le référencement)

fabricus a dit:
Par contre j'ai un petit souci, car en premières url il a généré http://www.france-immoplus.fr et http://www.france-immoplus.fr/index.htm
J'ai peur que ça fasse "doublon" , aussi j'ai enlevé la deuxième url et je n'ai laissé dans mon fichier sitemap.xml que la première ( http://www.france-immoplus.fr/ ) !

C'est donc que votre outil en ligne a trouvé les deux urls. Gooel les trouvera aussi. Le fait de corriger le sitemap ne corrige pas le vrai problème.

fabricus a dit:
Ai-je eu raison ? En fait aurait-il mieux valu laisser la deuxième ( http://www.france-immoplus.fr/index.htm ) ? Fallait-il laisser les deux ? Quelqu'un pourrait-il, svp, répondre à ces questions !

En théorie c'est indifférent, en pratique comme beaucoup de monde fera le lien vers le ndd sans index, c'est effectivement celle qu'il faut conserver.
Maintenant il faut aussi faire en sorte que index.htm soit redirigé vers le ndd de domaine seul, sinon Google trouvera toujours les deux urls.
Et pendant qu'on y est le même problème se pose avec le ndd sans et avec le www

fabricus a dit:
Pourriez-vous me dire s'il est correct au niveau "priorités" et "période de renouvellement" ?
Oui, il n'est pas correct. Toutes vos priorités sont égales ou supérieures à 0.5, ce n'est pas normal (si il y a des choses plus importantes, il y en a aussi qui le sont moins). Et vous avez plusieurs priorités 1, alors qu'il devrait n'y en avoir qu'une seule.
De plus, le "change frequency" est inutile et ne peut que ralentir le robot.
 
WRInaute passionné
Marie-Aude a dit:
Maintenant il faut aussi faire en sorte que index.htm soit redirigé vers le ndd de domaine seul, sinon Google trouvera toujours les deux urls.

Une option à cocher dans les paramètres des GWT permet d'indiquer à Google quelle est la structure à prendre en compte, soit l'une soit l'autre, mais pas les 2, cette redirection est donc effectuée sans autre intervention :wink:

Domaine favori
Le domaine favori est celui que vous souhaitez utiliser pour l'indexation des pages de votre site. Si vous avez indiqué http://www.exemple.fr comme domaine favori et que nous trouvons un lien vers votre site dont le format est http://exemple.fr, nous traitons ce lien comme s'il s'agissait de http://www.exemple.fr. En outre, nous tenons compte de vos préférences lors de l'affichage des URL dans nos résultats de recherche. Il peut s'écouler un certain temps avant que ces modifications apparaissent dans notre index.
 
WRInaute occasionnel
Bonjour Marie-Aude,

Tout d'abord merci pour votre intervention.

Marie-Aude a dit:
Maintenant il faut aussi faire en sorte que index.htm soit redirigé vers le ndd de domaine seul, sinon Google trouvera toujours les deux urls.
Et pendant qu'on y est le même problème se pose avec le ndd sans et avec le www

Par contre je ne sais pas comment remédier à ces deux problèmes.

Autrement j'ai modifié les priorités dans mon fichier sitemap et je n'en ai mis qu'une en 1.00

J'ai laissé le "change frequency" , je verrai plus tard si je l'enlève.

Merci encore pour votre aide.

Cordialement.
 
WRInaute impliqué
Marie aude a dit:
Et vous avez plusieurs priorités 1, alors qu'il devrait n'y en avoir qu'une seule.


je ne suis pas d'accord sur ce point.

Mon sitemap comporte plusieurs priorités 1
En fait au début j'avais tout mis en 1 et dans mes tools de google j'ai reçu un avertissement

Aujourd'hui http://www.apprentissage-virtuel.com/sitemap.xml (un paquet de 1)

Erreurs et avertissements relatifs au sitemap
Aucune erreur ni aucun avertissement trouvé.
 
WRInaute occasionnel
Bonjour,

GUITEL a dit:
je ne suis pas d'accord sur ce point.
Mon sitemap comporte plusieurs priorités 1
En fait au début j'avais tout mis en 1 et dans mes tools de google j'ai reçu un avertissement

En fait je suis étonné moi aussi que l'on ne puisse mettre qu'une priorité 1, ça n'a pas vraiment de sens !
Au départ j'avais compris que l'on classait les url en fonction de nos préférences de 0,1 à 1. Rien ne laisse supposer qu'il ne puisse pas y avoir plusieurs priorités identiques dont la priorité 1.

Je pense que vous avez raison, bien qu'il ne faille pas abuser, à mon avis, des priorités 1, sinon ça n'a plus de sens !

Cordialement.
 
WRInaute accro
Pour les priorités, l'importance est relative.
https://www.google.com/support/webmasters/bin/answer.py?answer=40318&topic=13450
ou
http://sitemaps.org/protocol.php

Il est illogique d'avoir plusieurs pages aussi importantes que la première page. Maintenant ce n'est pas une erreur technique.
De la même façon Google recommande un seul H1 par page, ça ne l'empêche pas d'indexer des pages avec plusieurs H1.

Mais ce n'est pas l'idéal.

On peut se poser la question autrement : si une page est aussi importante que la page d'accueil, pourquoi son contenu ne se trouve t il pas sur la page d'accueil ? Comment a t on choisi de ne pas l'y mettre ? Sans doute parce qu'il est légèrement moins important.

Rien n'empêche de mettre ces pages à 0.9
 
WRInaute impliqué
fabricus a dit:
Bonjour,

Je pense que vous avez raison, bien qu'il ne faille pas abuser, à mon avis, des priorités 1, sinon ça n'a plus de sens !

Cordialement.


Oui je pense que mettre une seule url en priorité 1, n'a pas de sens sur l'ensemble du site.

Maintenant j'ai montré un sitemap(dernier télechargement de ce mois) pour démontrer que les outils de google ne signalent rien, donc à priori..............
Celà ne veut pas dire que c'est un modèle, loin de là.

Ce sitemap a trop de 1, pour être cohérent avec ce site je devrais en mettre 5 maxi.


SUR le reste de la réponse de marie-aude je la rejoins complètement, surtout l'idée que le sitemap n'a aucun impact sur le positionnement.
 
WRInaute occasionnel
Bonjour,

Marie-Aude a dit:
Il est illogique d'avoir plusieurs pages aussi importantes que la première page. Maintenant ce n'est pas une erreur technique.
On peut se poser la question autrement : si une page est aussi importante que la page d'accueil, pourquoi son contenu ne se trouve t il pas sur la page d'accueil ? Comment a t on choisi de ne pas l'y mettre ? Sans doute parce qu'il est légèrement moins important.
Rien n'empêche de mettre ces pages à 0.9

Je pense que vous avez raison sur un point, la page la plus importante d'un site est la page d'accueil... de là à ne pas trouver que d'autres pages méritent la priorité 1 il y a un pas que je ne saurais franchir. On ne peut pas forcément tout mettre sur une page d'accueil et des choses importantes peuvent donc figurer sur d'autres pages du site.


GUITEL a dit:
Oui je pense que mettre une seule url en priorité 1, n'a pas de sens sur l'ensemble du site.
SUR le reste de la réponse de marie-aude je la rejoins complètement, surtout l'idée que le sitemap n'a aucun impact sur le positionnement.

Effectivement on peut supposer que sur un site plusieurs pages contiennent des éléments importants, les déclarer en priorité 1 ou 0,90 ne doit pas faire une grosse différence.
Tout bien réfléchi je suis partisan de ne laisser que la page d'accueil en priorité 1, les autres pages importantes du site étant déclarées en priorités entre 0,80 et 0,90.

Quoi qu'il en soit vous avez plus ou moins raison tous les deux, le reste est une affaire d'intuition personnelle.

Cordialement.
 
WRInaute impliqué
Marie-Aude a dit:


En lisant le lien, je me pose la question suivante:
puisque Les sitemaps sont particulièrement utiles dans les cas suivants :

Votre site intègre du contenu dynamique.
Toutes les pages de votre site n'ont pas été détectées par Googlebot lors du processus d'exploration (les pages avec du contenu AJAX ou Flash, par exemple).
Votre site est récent et seuls quelques liens permettent d'y accéder. Googlebot explore le Web en suivant les liens entre les différentes pages. Par conséquent, si le système de liens de votre site n'est pas cohérent, nos robots auront des difficultés à le détecter.
Votre site contient de nombreuses pages de contenu mal reliées entre elles ou non reliées du tout.

Donc en clair , le sitemap est une aide pour trouver le lien si le site est mal structuré (pour le robot).
Tout bien réfléchi je suis partisan de ne laisser que la page d'accueil en priorité 1, les autres pages importantes du site étant déclarées en priorités entre 0,80 et 0,90.
Le terme de priorité moi je le comprend dans ce sens: (dites moi si je me trompe)

robot quand tu es venu chez moi (parce que ma structure n'est pas bonne) tu n'as pas vue les pages x, y, Z.
Je te donne mon sitemap pour que tu puisses les prendres en comptes et je te demande lors de ton indexation de prendre la Y en premier (priorité 1).

ce n'est pas une note, un classement .... pour répondre indirectement à marie-aude
On peut se poser la question autrement : si une page est aussi importante que la page d'accueil, pourquoi son contenu ne se trouve t il pas sur la page d'accueil ? Comment a t on choisi de ne pas l'y mettre ? Sans doute parce qu'il est légèrement moins important.


Mais en relisant le lien, je me pose la question suivante:
A partir du moment que l'url est indexe par google:
Est il necessaire de laisser cette url dans le sitemap ?

Ne peut on pas envisagé à partir de là un sitemap evolutif en supprimant l'url indéxe et par conséquent soulagé le crawl du robot.

Qu'en pensez vous ???
 
WRInaute occasionnel
Bonsoir,

GUITEL a dit:
Donc en clair , le sitemap est une aide pour trouver le lien si le site est mal structuré (pour le robot).

On peut voir ça de cette façon, c'est surtout une aide pour être sûr que toutes les pages seront indexées.

GUITEL a dit:
Le terme de priorité moi je le comprend dans ce sens: (dites moi si je me trompe)
robot quand tu es venu chez moi (parce que ma structure n'est pas bonne) tu n'as pas vue les pages x, y, Z.
Je te donne mon sitemap pour que tu puisses les prendres en comptes et je te demande lors de ton indexation de prendre la Y en premier (priorité 1).
ce n'est pas une note, un classement .... pour répondre indirectement à marie-aude

Si, pourtant c'est bien un classement des pages en fonction de leur importance, la priorité 1 étant la page qu'il faut impérativement indexer, les priorités basses étant des pages qui peuvent être éventuellement ignorées.

GUITEL a dit:
Mais en relisant le lien, je me pose la question suivante:
A partir du moment que l'url est indexe par google:
Est il necessaire de laisser cette url dans le sitemap ?
Ne peut on pas envisagé à partir de là un sitemap evolutif en supprimant l'url indéxe et par conséquent soulagé le crawl du robot.
Qu'en pensez vous ???

Je ne pense pas qu'un sitemap évolutif voit le nombre d'url diminuer, c'est le contraire, un sitemap évolutif est un sitemap qui renferme de plus en plus d'url au fur et à mesure de l'évolution du site.

Cordialement.
 
WRInaute impliqué
fabricus a dit:
On peut voir ça de cette façon, c'est surtout une aide pour être sûr que toutes les pages seront indexées.
https://www.google.com/webmasters/tools/docs/fr/protocol.html

Le recours à ce protocole ne garantit pas la prise en compte de vos pages Web dans les index de recherche

fabricus a dit:
Si, pourtant c'est bien un classement des pages en fonction de leur importance, la priorité 1 étant la page qu'il faut impérativement indexer, les priorités basses étant des pages qui peuvent être éventuellement ignorées..

Notez que l'utilisation de ce protocole n'influe pas sur le mode de classement de vos pages par un moteur de recherche.

fabricus a dit:
Je ne pense pas qu'un sitemap évolutif voit le nombre d'url diminuer, c'est le contraire, un sitemap évolutif est un sitemap qui renferme de plus en plus d'url au fur et à mesure de l'évolution du site.

C'est effectivement, l'usage que l'on en fait.(moi le premier)
La question aller dans le sens si une page (déjà) indexée est retirée du sitemap. il se passe quoi ??
Je ne pense pas qu'elle sera désindexée pa GG.
 
WRInaute occasionnel
Bonsoir,

GUITEL a dit:
C'est effectivement, l'usage que l'on en fait.(moi le premier)
La question aller dans le sens si une page (déjà) indexée est retirée du sitemap. il se passe quoi ??
Je ne pense pas qu'elle sera désindexée pa GG.

Il apparaît certain que si une page déjà indexée est retirée du sitemap elle ne sera pas désindexée par GG, tout au moins dans un premier temps. Mais si elle est retirée du sitemap c'est, en principe, parce qu'elle n'existe plus et donc, à terme, elle sera forcément désindexée.

Cordialement.
 
WRInaute passionné
fabricus a dit:
Mais si elle est retirée du sitemap c'est, en principe, parce qu'elle n'existe plus et donc, à terme, elle sera forcément désindexée.
Bonjour Fabricus,
Effectivement, en toute logique, mais c'est la durée du 'terme' qu'on ne maîtrise pas :wink:
Ybet te dirait que GG garde tout en mémoire :wink:
 
WRInaute impliqué
fabricus a dit:
Bonsoir,

Mais si elle est retirée du sitemap c'est, en principe, parce qu'elle n'existe plus et donc, à terme, elle sera forcément désindexée.

Cordialement.


Alors comment font les sites qui n'utilisent pas de sitemap ?
Ils ne sont pas invisibe de GG et leur indexation ne part pas !!!

Non je ne crois pas à cette hypothèse. Du moins, je ne suis pas convaincu par vos arguments.
 
WRInaute occasionnel
Bonsoir,

GUITEL a dit:
Alors comment font les sites qui n'utilisent pas de sitemap ?
Ils ne sont pas invisibe de GG et leur indexation ne part pas !!!
Non je ne crois pas à cette hypothèse. Du moins, je ne suis pas convaincu par vos arguments.

Les pages des sites qui n'utilisent pas de sitemap sont effectivement indexées par Google. Mais lorsqu'une page "disparaît" que ce soit avec ou sans sitemap Google finit par la désindexer... du moins je le pense et j'en suis même sûr puisque j'ai vécu le cas avec mon ancien site, où les pages supprimées ont été désindexées au bout d'un certain temps ( + ou - long ! ).

Cordialement.
 
WRInaute impliqué
fabricus a dit:
Bonsoir,

GUITEL a dit:
Alors comment font les sites qui n'utilisent pas de sitemap ?
Ils ne sont pas invisibe de GG et leur indexation ne part pas !!!
Non je ne crois pas à cette hypothèse. Du moins, je ne suis pas convaincu par vos arguments.

Les pages des sites qui n'utilisent pas de sitemap sont effectivement indexées par Google. Mais lorsqu'une page "disparaît" que ce soit avec ou sans sitemap Google finit par la désindexer... du moins je le pense et j'en suis même sûr puisque j'ai vécu le cas avec mon ancien site, où les pages supprimées ont été désindexées au bout d'un certain temps ( + ou - long ! ).

Cordialement.


Là forcément si la page http://www.monsite.com/truc.php n'est plus existante de votre site. GG n'a aucune raison de l'indexer/conserver.

je parle d'une page qui existe toujours, connu par GG mais qui est seulement supprimer dans le sitemap.

Par ex, on discute sur un forum dédié sur le positionnement/référencement
le sitemap de wri, il est super bien caché !! que moi j'en vois pas. Donc sans sitemap les pages de WRI sont bien conservées !!
Un site portail sur le thème de la formation http://www.studya.com il n'utilise pas de sitemap. Il ne peut pas se permettre qu'une page disparaisse de GG.
Bref, je pourrais mettre plusieurs exemple de ce type d'oû ma question de base.

Pourquoi nous conservons toutes nos url dans nos sitemap y compris ceux qui sont indexées ?
Concrètement quelle est l'intérêt d'avoir de + 150 pages dans son sitemap ?? Quelles sont les conséquences ??
 
WRInaute occasionnel
GUITEL a dit:
Pourquoi nous conservons toutes nos url dans nos sitemap y compris ceux qui sont indexées ?
Concrètement quelle est l'intérêt d'avoir de + 150 pages dans son sitemap ?? Quelles sont les conséquences ??

Je pense que l'intérêt de conserver toutes nos url dans notre sitemap est de pouvoir indiquer quand une page est modifiée.
Je crois que lorsque les robots passent en revue le sitemap ils prennent en compte les dates de modification pour modifier le cache d'une page, par exemple.

Tout ceci n'est que pure supposition car en fait on ne connaît pas exactement la finalité du sitemap et son utilisation par Google. Je pense cependant qu'il est primordial de tenir le sitemap à jour et que c'est un plus pour l'indexation.

Cordialement.
 
WRInaute impliqué
Je pense que l'intérêt de conserver toutes nos url dans notre sitemap est de pouvoir indiquer quand une page est modifiée.
Je crois que lorsque les robots passent en revue le sitemap ils prennent en compte les dates de modification pour modifier le cache d'une page, par exemple.

Oui l' exemple cité me semble interressant

Tout ceci n'est que pure supposition car en fait on ne connaît pas exactement la finalité du sitemap et son utilisation par Google. Je pense cependant qu'il est primordial de tenir le sitemap à jour et que c'est un plus pour l'indexation..


D'un point de vue général on est d'accord. Je pense plutôt que nos opinions se portent sur l'intérêt et l'importance (primordial pour vous) que l'on porte sur le sitemap.
 
WRInaute accro
Comme on m'a demandé mon avis en MP de répondre et que j'ai pas envie de faire des copier coller ....

1. j'utilise pas de site map ... donc croire qu'un site qui n'a pas de site map n'est pas indexé c'est idiot. Le sitemap permet d'indexer toutes les pages reprises. Pourtant, si une page d'un site n'est finalement visible que par le site map, ca montre bien que la structure des liens internes du site est mauvaise. En plus, une page se positionne par son contenu, ses liens internes et externes. Jamais vu une page avec un bon contenu se placer sans "bons" liens internes (remarquez le pluriel). Le sitemap permet de faire indexer des pages profondes (génial) mais ne permet de toute façon que les positionner via leur contenu.
2. avec un sitemap, GG va effectivement détecter la page plus vite (quoique), la désindexer probablement plus vite (au conditionnel aussi) et prendre en compte plus vite les modifications. On va dire que c'est un gros avantage. Par contre, je préfère qu'il trouve les nouvelles pages via les liens (et surtout le texte du lien). Si le site est bien fait, minimum 90 % des pages doivent être vue une fois toutes les semaines (gros ou petit site d'aillieur et en oubliant les forums qui ont une structure trop spécifique au niveau des liens vers les pages de posts (pas de contenu) dans les catégorie: la normalement, seule les 10 premières pages ont un lien en bas ...).
3. Pour l'effet de mémoire. Ca ne joue pas sur le nom de la page, juste son contenu. Supprimer une page pour en faire la même sous un autre nom nécessite au minimum une redirection (pas une simple suppression de la page sur le serveur). Sinon, GG va mémoiser le contenu pour le comparer avec le contenu de la nouvelle page. Si c'est interne, ca prendra plus de temps pour indexer la nouvelle. Si c'est externe .... ca peut pénaliser la nouvelle page. (et des petits tests d'autres montrent des problèmes avec des copies externes de pages disparues depuis minimum 3 ans).
 
Discussions similaires
Haut