Messages: 2192

Enregistré le: 2 Avr 2005

Message le Mer Juin 29, 2005 19:39

J'avais promis dans un post précédant de publier mon script PHP de génération dynamique de fichier sitemap.xml, alors voila.

Le principe consite à faire générer les données du fichier sitemap par les visiteurs de votre site (bien pratique pour les sites ayant de nombreuses pages générées dynamiquement). A chaque visite, on génére un petit fichier (s'il n'existe pas) contenant l'url de la page et la date courante:

Code: Tout sélectionner
<?php
   $urldemandee=$_SERVER['REQUEST_URI']; // on récupère l'url de la page courante
   // on met cette url en forme pour en faire un nom de fichier valide
   $urldemandee=ereg_replace('/','-',$urldemandee);
   if($urldemandee=="-") $urldemandee="-index.html";
   $fichierSitemaps="sitemaps".$urldemandee;
   $fichierSitemaps=str_replace('sitemaps-','',$fichierSitemaps);
      // on teste si le fichier existe déjà
     if(file_exists("/cheminabsolut/sitemaps/ ".$fichierSitemaps)==false) { 
      $fd = fopen("sitemaps/".$fichierSitemaps, "w"); //on ouvre le fichier
      if ($fd) {
         if($_SERVER['REQUEST_URI']=="/") $filtrePage="/index.html";else $filtrePage=$_SERVER['REQUEST_URI']; //on evite de dupliquer domaine.com et domaine.com/index.html
         $sitemapsContent="<url>\n\t<loc>http://www.domaine.com".$filtrePage."</loc>\n\t<lastmod>".date('Y-m-d')."T".date('H:m:s+00:00')."</lastmod>\n</url>\n"; //on formate les infos pour le XML
         fwrite($fd,$sitemapsContent); //on ecrit le fichier
         fclose($fd);//on ferme le fichier
       }
   }
?>


Maintenant on fait un script que l'on place par exemple à la racine du site sous le nom monsitemap.php:


Code: Tout sélectionner
<?
echo'<'.'?xml version="1.0" encoding="UTF-8"?'.'>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
';
foreach (glob("/cheminabsolut/sitemaps/*.*") as $filename) {
   $filename = str_replace("/cheminabsolut/','',$filename);
   include ($filename);
}

echo"</urlset>";
?>


Maintenant on ajoute une regle dans le .htaccess:
Code: Tout sélectionner
RewriteRule ^sitemap\.xml$ /monsitemap.php [QSA,L]


Je vous laisse le soin d'intégrer le script nécéssaire à l'effacement des fichiers du repertoire sitemaps dans votre backoffice pour gerer les mises à jour! :wink:

note: Pour les sites qui comprennent un nombre de pages proche de la limite fixée par google pour le fichier sitemap, je publierais prochainement une adaptation gérant les fichiers sitemaps en cascade....
Modifié en dernier par fandecine le Jeu Juin 30, 2005 15:26, modifié 1 fois.
Haut
90 Réponses
Messages: 220

Enregistré le: 17 Nov 2004

Message le Jeu Juin 30, 2005 0:54

stp je suis tres interessé par ton script tu peux m'expliquer comment ca marche!!

esque c possible d'interdire des url de pages comme robots??
je suis pas tres intéligent je te l'accorde

le 1er script je le place sur toutes mes pages
le 2emme je change cheminabsolut en /home/www...
Haut
Messages: 2192

Enregistré le: 2 Avr 2005

Message le Jeu Juin 30, 2005 8:30

netsba a écrit:le 1er script je le place sur toutes mes pages

Uniquement dans les pages que tu veux inclure au fichier sitemap...
netsba a écrit:le 2emme je change cheminabsolut en /home/www...
oui
Haut
Messages: 306

Enregistré le: 11 Aoû 2004

Message le Jeu Juin 30, 2005 15:18

Il y a 2 erreurs de progra dans ton code fandecine :

Code: Tout sélectionner
<?php
   $urldemandee=$_SERVER['REQUEST_URI']; // on récupère l'url de la page courante
   // on met cette url en forme pour en faire un nom de fichier valide
   $urldemandee=ereg_replace('/','-',$urldemandee);
   if($urldemandee=="-") $urldemandee="-index.html";
   $fichierSitemaps="sitemaps".$urldemandee;
   $fichierSitemaps=str_replace('sitemaps-','',$fichierSitemaps);
      // on teste si le fichier existe déjà
     if(![color=red]([/color]file_exists("/cheminabsolut/sitemaps/  ".$fichierSitemaps)!==false) {
      $fd = fopen("sitemaps/".$fichierSitemaps[color=red]"[/color], "w"); //on ouvre le fichier
      if ($fd) {
         if($_SERVER['REQUEST_URI']=="/") $filtrePage="/index.html";else $filtrePage=$_SERVER['REQUEST_URI']; //on evite de dupliquer domaine.com et domaine.com/index.html
         $sitemapsContent="<url>\n\t<loc>http://www.domaine.com".$filtrePage."</loc>\n\t<lastmod>".date('Y-m-d')."T".date('H:m:s+00:00')."</lastmod>\n</url>\n"; //on formate les infos pour le XML
         fwrite($fd,$sitemapsContent); //on ecrit le fichier
         fclose($fd);//on ferme le fichier
       }
   }
?>


A enlever les deux fois :wink:
Pas encore testé le script.

---------
Edit :
Encore 2 erreurs :
Code: Tout sélectionner
<?
echo'<'.'?xml version="1.0" encoding="UTF-8"?'.'>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
';
foreach(glob("/cheminabsolu/*.*") as $filename) {
   $filename = str_replace("/cheminabsolu/[color=red]',''[/color],$filename);
   include ($filename);
}

echo "</urlset>";
?>
Haut
Messages: 2192

Enregistré le: 2 Avr 2005

Message le Jeu Juin 30, 2005 15:29

Jaunalgi a écrit:Il y a 2 erreurs de progra dans ton code fandecine :
A enlever les deux fois :wink:
Pas encore testé le script.


OOPS! :oops: ça m'apprendra!
J'ai édité le post pour le corriger! :D

il y en a au moins un qui suit! :wink:
Haut
Messages: 306

Enregistré le: 11 Aoû 2004

Message le Jeu Juin 30, 2005 15:32

J'ai testé le script après avoir modifié les erreurs que je t'ai donné plus haut.

Voici le script après correction :wink:
Code: Tout sélectionner
<?php
   $urldemandee=$_SERVER['REQUEST_URI']; // on récupère l'url de la page courante
   // on met cette url en forme pour en faire un nom de fichier valide
   $urldemandee=ereg_replace('/','-',$urldemandee);
   if($urldemandee=="-") $urldemandee="-index.html";
   $fichierSitemaps="sitemaps".$urldemandee;
   $fichierSitemaps=str_replace('sitemaps-','',$fichierSitemaps);
      // on teste si le fichier existe déjà
     if(!file_exists("//cheminabsolu/sitemaps/".$fichierSitemaps)!==false) {
      $fd = fopen("sitemaps/".$fichierSitemaps,"w"); //on ouvre le fichier
      if ($fd) {
         if($_SERVER['REQUEST_URI']=="/") $filtrePage="/index.html";else $filtrePage=$_SERVER['REQUEST_URI']; //on evite de dupliquer domaine.com et domaine.com/index.html
         $sitemapsContent="<url>\n\t<loc>http://www.grandprix4.org".$filtrePage."</loc>\n\t<lastmod>".date('Y-m-d')."T".date('H:m:s+00:00')."</lastmod>\n</url>\n"; //on formate les infos pour le XML
         fwrite($fd,$sitemapsContent); //on ecrit le fichier
         fclose($fd); //on ferme le fichier
       }
   }
?>


Code: Tout sélectionner
<?php
header("Content-Type: text/xml"); // On déclare un fichier XML
echo'<'.'?xml version="1.0" encoding="UTF-8"?'.'>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
';
foreach(glob("/cheminabsolu/sitemaps/*.*") as $filename) {
   $filename = str_replace("/cheminabsolu/","",$filename);
   include ($filename);
}

echo "</urlset>";
?>


Code: Tout sélectionner
RewriteRule ^sitemap\.xml$ /monsitemap.php [QSA,L]


ç'a l'air de bien fonctionner maintenant :
/** URL editée par Jaunalgi - sitemap hors ligne **/

Petit bémol : je ne veux pas indexer index.html pour éviter le conflit avec le domaine seul.
Modifié en dernier par Jaunalgi le Mar Sep 19, 2006 12:54, modifié 1 fois.
Haut
Messages: 43

Enregistré le: 10 Fév 2004

Message le Jeu Juin 30, 2005 17:17

Si je ne me trompe pas, ton fichier xml contient plusieurs fois la même page (en particulier ta page d'accueil).
Haut
Messages: 306

Enregistré le: 11 Aoû 2004

Message le Jeu Juin 30, 2005 17:37

Ah oui, bien vu.

C'est bizarre ça :o J'ai ptêt fait une erreur de paramétrage alors...

----------------
Edit : j'avais mis une ligne en commentaire et du coup, la page d'accueil revenait sans cesse, bien vu fuleran :wink:
Haut
Messages: 97

Enregistré le: 21 Sep 2004

Message le Ven Juil 01, 2005 7:51

Bonjour à toutes et à tous,

à ce propos, j'ai trouvé un petit site bien pratique :

http://www.autositemap.com

Il permet, en affichant un marqueur sur les pages d'un site, de générer dynamiquement le sitemap d'un site.

Le principe est simple, chaque requête à l'image en question contient (du moins pour la majorité des personnes visitant le site) le referer de cette image. Donc, il ne reste plus qu'à extraire d'une base de données tous les réfèrants, de formater l'affichage et hop ;)

Olivier
Haut
Messages: 2192

Enregistré le: 2 Avr 2005

Message le Ven Juil 01, 2005 17:17

Jaunalgi a écrit:Petit bémol : je ne veux pas indexer index.html pour éviter le conflit avec le domaine seul.


d'ou l'interet de ce bout de code: :wink:
Code: Tout sélectionner
if($_SERVER['REQUEST_URI']=="/") $filtrePage="/index.html";else $filtrePage=$_SERVER['REQUEST_URI']; //on evite de dupliquer domaine.com et domaine.com/index.html
Haut
Messages: 44

Enregistré le: 29 Mai 2005

Message le Sam Juil 02, 2005 23:49

Merci pour ce script, très pratique :p
Haut
Messages: 21

Enregistré le: 3 Aoû 2004

Message le Mar Juil 12, 2005 17:36

SiteMap google

Salut Fandcine

je suis trés intéréssé par ce script, par contre je sais comment l'installer :

le 1er bloc, ou ?
2em ou ?

les deux blocs de codes dans le meme page sitemap.php ?

j'ai essayé, mais une erreur : (j pense problem de chemin )

Parse error: parse error, unexpected T_IF in /home/besthoteu/www/spain/monsitemap.php on line 5

Merci par avance
Haut
Messages: 2192

Enregistré le: 2 Avr 2005

Message le Mer Juil 13, 2005 15:18

le premier bloc de code doit être inserré dans toutes les pages du site.

Le second est un script php (fichier sitemap.php) permettant de générer les données du fichier sitemap. Si on inserre le troisième le bloc de code dans le fichier htacces, l'appel de sitemap.xml affichera le fichier sitemap!

voila! :D
Haut
Messages: 19

Enregistré le: 30 Jan 2005

Message le Mer Juil 20, 2005 18:49

Bjr,

Merci beaucoup pour ce très pratique script fandecine ! :)

Après quelques tests cela me génere bien monsitemap.php

Par contre comme je lisais la notice de google et voyais les autres tags : du syle <changefreq> et <priority>, ceux si sont optionnels d'accord, mais je me demandais si cela était vraiment nécessaire de les créer ???

Si cela apportais quelques choses pour le référencement, la rapidité de ref, etc.. ?

Merci d'avance :)

JY


PS: je modifie mon post pour ajouter les quelques lignes de code pour ces 2 tags:


Code: Tout sélectionner
//  la fréquence de renouvellement de la page
$changefreq=array(0=>'always',
                             1=>'hourly',
                2=>'daily',
                3=>'weekly',
                4=>'monthly',
                5=>'yearly',
                6=>'never');
// 0.0 to 1.0, The default priority of a page is 0.5
$priority='0.4';
$sitemapsContent="<url>\n\t<loc>http://www.votresite.com".$filtrePage."</loc>\n\t<lastmod>".date('Y-m-d')."T".date('H:m:s+00:00')."</lastmod>\n<changefreq>".$changefreq[2]."</changefreq>\n<priority>".$priority."</priority>\n</url>\n"; //on formate les infos pour le XML


Et plus qu'a executer http://www.votresite.com/monsitemap.php

Plus qu'a faire une fonction de tout ça, pour faire plus beau :wink:
Haut
Messages: 2192

Enregistré le: 2 Avr 2005

Message le Jeu Juil 21, 2005 0:16

jyl a écrit:Par contre comme je lisais la notice de google et voyais les autres tags : du syle <changefreq> et <priority>, ceux si sont optionnels d'accord, mais je me demandais si cela était vraiment nécessaire de les créer ???


Personnellement, je n'ais pas assez de recul sur l'utilisation de GGSitemap pour dire si ces tags apportent quelquechose ou pas. J'ai choisi la simplicité en les ignorant... pour l'instant.
Haut
Messages: 19

Enregistré le: 30 Jan 2005

Message le Jeu Juil 28, 2005 16:30

Bjr à tous,

Je me posais une question sur les urls à ajouter dans le sitemap :?:

Par exemple dans ma page "club", l'url est "www.monsite.com/club.html" (grace à url_rewrite) mais après si l'internaute clique sur un club, l'url n'est pas ré-ecrite mais est du style "..com/index.php?page=club&region....."

Alors d'après le principe du sitemap faut-il ajouter les différentes pages attachées ? Quitte à avoir un sitemap qui ressemble à cela :
Code: Tout sélectionner
http://www.4x4rdv.com/sitemap.xml
ou bien juste les premières pages de chaques rubriques qui donne cela :
Code: Tout sélectionner
http://www.4x4rdv.com/sitemap1.xml
?

Qu'en pensez-vous ???

Merci d'avance

JYL
Haut
Messages: 412

Enregistré le: 2 Mar 2005

Message le Sam Juil 30, 2005 10:20

Excellent, merci à fandecine. Je l'ai testé et adopté.

J'ai toutefois relevé une petite erreur sur la fonction date dans le script à mettre sur chaque page.

date('H:m:s+00:00')


remplacer par

date('H:i:s+00:00')


c'est mieux d'avoir les minutes au lieu du mois :wink:

Voici les scripts modifiés à ma sauce. J'ai notamment remplacé chemin absolu et nom de domaine par les variables prédéfinies de php : $DOCUMENT_ROOT et $HTTP_HOST


Code: Tout sélectionner

<?php
   
   // SITEMAP AUTO  - à placer sur chaque page - fonctionne avec monsitemap.php et .htaccess
   
   $urldemandee=$_SERVER['REQUEST_URI']; // on récupère l'url de la page courante
   // on met cette url en forme pour en faire un nom de fichier valide
   $urldemandee=ereg_replace('/','-',$urldemandee);
   if($urldemandee=="-") $urldemandee="-index.php";
   $fichierSitemaps="sitemaps".$urldemandee;
   $fichierSitemaps=str_replace('sitemaps-','',$fichierSitemaps);
      // on teste si le fichier existe déjà (les fichiers sont supprimés par pictext à chaque maj)
     if(file_exists($DOCUMENT_ROOT."/sitemaps/".$fichierSitemaps)==false) {
      $fd = fopen("sitemaps/".$fichierSitemaps, "w"); //on ouvre le fichier
      if ($fd) {
         if($_SERVER['REQUEST_URI']=="/") $filtrePage="/index.php";else $filtrePage=$_SERVER['REQUEST_URI']; //on evite de dupliquer domaine.com et domaine.com/index.html
         $sitemapsContent="<url>\n\t<loc>http://".$HTTP_HOST.$filtrePage."</loc>\n\t<lastmod>".date('Y-m-d')."T".date('H:i:s+00:00')."</lastmod>\n</url>\n"; //on formate les infos pour le XML
         fwrite($fd,$sitemapsContent); //on ecrit le fichier
         fclose($fd);//on ferme le fichier
       }
   }
?>



Code: Tout sélectionner

<?php

// monsitemap.php

header("Content-Type: text/xml"); // On déclare un fichier XML
echo'<'.'?xml version="1.0" encoding="UTF-8"?'.'>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84"  xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
 xsi:schemaLocation="http://www.google.com/schemas/sitemap/0.84 http://www.google.com/schemas/sitemap/0.84/sitemap.xsd">
';
foreach(glob($DOCUMENT_ROOT."/sitemaps/*.*") as $filename) {
   $filename = str_replace($DOCUMENT_ROOT."/","",$filename);
   include ($filename);
}

echo "</urlset>";
?>

Modifié en dernier par yvan02 le Lun Aoû 01, 2005 13:54, modifié 1 fois.
Haut
Messages: 306

Enregistré le: 11 Aoû 2004

Message le Sam Juil 30, 2005 12:59

yvan02 a écrit:Voici les scripts modifiés à ma sauce. J'ai notamment remplacé chemin absolu et nom de domaine par les variables prédéfinies de php : $DOCUMENT_ROOT et $HTTP_HOST


Si ton serveur n'utilise pas register_global sur on, ça ne fonctionnera pas.
Je te conseille $_SERVER['DOCUMENT_ROOT'] au lieu de $DOCUMENT_ROOT par exemple :wink:
Haut
Messages: 412

Enregistré le: 2 Mar 2005

Message le Sam Juil 30, 2005 14:07

je note, merci.

sur mon serveur, ça marche comme ça ( suis chez OVH)
Haut
Messages: 21

Enregistré le: 10 Déc 2002

Message le Jeu Aoû 11, 2005 10:39

[SCRIPT] sitemap Google

Bonjour et merci pour ce script très utile.

N"étant un pro du php, comment "l'installer" dans le cadre d'un site php avec une page index et dont le contenu de chaque rubrique du menu est appelé par un switch / case ?

Merci de votre aide :)
Haut
Messages: 3

Enregistré le: 26 Juil 2005

Message le Mer Sep 07, 2005 16:35

P'tit script sitemap.php

Bonjour !

Voila un script que j'ai fait pour lister seulement les pages pertinantes de mes sites et la date à laquelle elles ont été modifiés pour la dernière fois. Je pense que ça peut en intérresser certains ;-)

Voir dans les commentaires du code ci-dessous pour l'installer sur votre site ...

Code: Tout sélectionner
<?php
/**
 * Ce script permet de génerer le fichier XML pour Google Site Map (https://www.google.com/webmasters/sitemaps/).
 * Google Site Map a pour but d'établir la liste des pages importantes du site afin d'améliorer le référencement
 * - ce script est à placer à la racine du site
 * - la date "lastmod" sera calculé grâce à la fonction "filemtime()" qui déterminera la date de modification du fichier - si la date "lastmod" est définie dans le tableau "$tabPages", elle sera prioritaire
 *
 * @author Thomas Pequet
 * @url http://www.memotoo.com
 * @version 1.0
 */

// Adresse du site
$adresseSite = "http://www.votreadresse.com";

// Listes des pages à afficher (par rapport à la racine)
// lastmod: date (en option - par defaut le script prendra la date de modification du fichier)
// priority: de 1.0 à 0.0 (en option - par default 0.5)
// changefreq: always - hourly - daily - weekly - monthly - yearly - never (en option)
$tabPages = array(
    "exemple1.html" => array(
        "lastmod" => "2004-05-01T12:15:12+00:00",
        "priority" => "0.6",
        "changefreq" => "monthly",
    ),
    "exemple2.html" => array(
        "lastmod" => "2004-05-01",
        "priority" => "0.1",
    ),
    "exemple3.php?toto=titi" => array(
        "lastmod" => date("Y-m-d\TH:i:s+00:00",filemtime("exemple3.php")),
        "priority" => "1.0",
        "changefreq" => "monthly",
    ),
    "dossier/exemple4.php" => array(
        "lastmod" => "",
        "priority" => "1.0",
        "changefreq" => "monthly",
    ),
);

// Cas de la racine du site
$tabPages[""] = $tabPages["index.php"];

// Tri du tableau sur le nom des pages
ksort($tabPages);

// Envoie des en-tetes en XML
header("Content-Type: text/xml");
header('Content-Disposition: inline; filename="sitemap.xml"');   
echo "<?xml version=\"1.0\" encoding=\"UTF-8\"?>\r\n";
?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
<?
// Parcours des pages
$tabPages_keys = array_keys($tabPages);
for ($i=0;$i<sizeof($tabPages_keys);$i++)
{
?>
 <url>
  <loc><?=$adresseSite."/".utf8_encode(htmlspecialchars($tabPages_keys[$i]));?></loc>
<?
    if (isset($tabPages[$tabPages_keys[$i]]["lastmod"]) && $tabPages[$tabPages_keys[$i]]["lastmod"]!="")
    {

?>
  <lastmod><?=$tabPages[$tabPages_keys[$i]]["lastmod"];?></lastmod>
<?
    }
    else if (is_file($tabPages_keys[$i]))
    {
?>
  <lastmod><?=date("Y-m-d\TH:i:s+00:00",filemtime($tabPages_keys[$i]));?></lastmod>
<?
    }

    if (isset($tabPages[$tabPages_keys[$i]]["changefreq"]) && $tabPages[$tabPages_keys[$i]]["changefreq"]!="")
    {
?>
  <changefreq><?=$tabPages[$tabPages_keys[$i]]["changefreq"];?></changefreq>
<?
    }   

    if (isset($tabPages[$tabPages_keys[$i]]["priority"]) && $tabPages[$tabPages_keys[$i]]["priority"]!="")
    {
?>
  <priority><?=$tabPages[$tabPages_keys[$i]]["priority"];?></priority>
<?
    }
?>
 </url> 
<?   
}
?>
</urlset>


Thomas
Haut
Messages: 95

Enregistré le: 9 Oct 2005

Message le Mar Oct 11, 2005 18:21

SAlut,
Comme je suis nouveau, je ne sais pas ce que c'est le sitemap ?
Quelqu'un pourrais m'eclairé ?
Merci ;)
Daf'
Haut
Messages: 2181

Enregistré le: 6 Jan 2005

Message le Mer Oct 12, 2005 11:32

Quelqu'un pourrais m'eclairer ?


utilise la boite de recherche en haut de de page, tu trouveras tout ce qu'il y a à savoir.

pour résumer en quelques mots : Il s'agit d'un plan de site reconnu par les robots de google pour faciliter l'indexation de pages.
Haut
Messages: 26

Enregistré le: 2 Sep 2005

Message le Dim Oct 30, 2005 20:15

Excellent idée d' utiliser l' url rewriting pour les sitemaps !

J' ai remarqué que certains sites avaient des "sous-liens".
Par exemple si tu tappe xiti dans google tu vas avoir
sous le titre des liens vers "Espace Abonné", "Démonstration"...

Est ce que c' est bien les sitemaps qui permettent d' avoir ca ?

Est ce qu on peut avour ces "sous-liens" sur une page autre que index.htm?

Merci d' avance
Haut
Messages: 2192

Enregistré le: 2 Avr 2005

Message le Mar Nov 01, 2005 14:12

je pense que tu confond avec le clustering!

Lorsque google trouve deux pages d'un même site dans une page de resultats, il procéde de la sorte. Mais cela n'a rien à voir avec le fichier sitemap dont la seule utilité est de faciliter le travail du robot d'indexation de Google.
Haut
Messages: 62

Enregistré le: 11 Mai 2005

Message le Jeu Nov 24, 2005 18:06

fandecine a écrit:note: Pour les sites qui comprennent un nombre de pages proche de la limite fixée par google pour le fichier sitemap, je publierais prochainement une adaptation gérant les fichiers sitemaps en cascade....


c'est quoi la limite fixé par google ?
Haut
Messages: 2192

Enregistré le: 2 Avr 2005

Message le Jeu Nov 24, 2005 20:20

Encore un qui ne lit pas les topics de WRI! :wink:

Aller, je suis sympa! :D

Vous pouvez compresser vos fichiers Sitemap à l'aide de l'utilitaire gzip. Cette compression réduira le besoin de bande passante. Notez que la taille de votre fichier Sitemap non compressé ne doit pas être supérieure à 10 Mo.


et encore

Vous pouvez fournir plusieurs fichiers Sitemap, sachant que pour chacun d'eux le nombre d'URL est limité à 50 000 et que la taille de chaque fichier ne doit pas dépasser 10 Mo (10 485 760 octets) avant compression. Ces limites contribuent à éviter la surcharge de votre serveur Web lors de la présentation à Google de fichiers volumineux.

Si vous voulez répertorier plus de 50 000 URL, vous devez créer plusieurs fichiers Sitemap. De même, si vous pensez qu'à terme votre plan Sitemap risque de compter plus de 50 000 URL ou de dépasser les 10 Mo, vous pouvez envisager de créer d'emblée plusieurs fichiers. Si vous procédez ainsi, pensez à répertorier vos différents plans Sitemap dans un fichier d'index Sitemap. Les fichiers d'index Sitemap ne peuvent pas compter plus de 1 000 plans.


enfi, tout est disponible à l'adresse https://www.google.com/webmasters/sitem ... tocol.html et en français en plus!

Maintenant, tu n'as plus d'excuses.... :wink:
Haut
Messages: 447

Enregistré le: 8 Nov 2004

Message le Ven Nov 25, 2005 2:02

fandecine a écrit:je pense que tu confond avec le clustering!

Lorsque google trouve deux pages d'un même site dans une page de resultats, il procéde de la sorte. Mais cela n'a rien à voir avec le fichier sitemap dont la seule utilité est de faciliter le travail du robot d'indexation de Google.


Ou plutôt avec les nouveaux liens qui sont apparus depuis le mois d'août pour certains sites et dont on parle ici : http://www.webrankinfo.com/forums/viewtopic.php?t=34323&postdays=0&postorder=asc&start=0

Sinon je vais tester ton script Fandecine, il me plait bien (du moins le côté "automatisé" du script)
Haut
Messages: 110

Enregistré le: 1 Déc 2003

Message le Dim Nov 27, 2005 21:48

Bonjour,

Je mexcuse de m'incruster dans la conversation mais je voudrais savoir si avec le fichier sitemap.xml dont on parle plus haut on peut générer un plan de site affichable dans une page web comme par exemple le plan du site de webrankinfo (voir lien bas de cette page)

merci d'avance pour vos réponses... :)
Haut
Messages: 138

Enregistré le: 18 Nov 2002

Message le Sam Déc 10, 2005 17:02

Merci pour ces scripts :)
Haut