Full crawl trés incomplet
11 messages
• Page 1 sur 1
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
- BDGest
- WRInaute occasionnel

- Messages: 279
- Inscription: 6 Jan 2003
Full crawl trés incomplet
Ce mois ci, google à complètement oublié une partie de mon site (le forum) lors du full crawl alors que le mois dernier, il était bien passé partout. Voici mon fichier robots.txt que j'ai mis en place suite à l'url rewriting. Vous croyez que cela peut venir de ça :
- Code: Tout sélectionner
User-agent: *
Disallow: /images/
Disallow: /old_forum/
Disallow: /old_forum_sav/
Disallow: /ftp/
Disallow: /images/
Disallow: /forum/login.php
Disallow: /forum/modcp.php
Disallow: /forum/posting.php
Disallow: /forum/privmsg.php
Disallow: /forum/search.php
Disallow: /forum/viewonline.php
Disallow: /forum/viewmessage
Disallow: /forum/viewforum.php
Disallow: /forum/viewtopic.php
Disallow: /forum/statistics.php
Disallow: /forum/site_hist.php
Disallow: /forum/profilephoto_mod.php
Disallow: /forum/profile.php
Disallow: /forum/memberlist.php
Disallow: /forum/ranking.php
Disallow: /forum/groupcp.php
Disallow: /forum/ranking.php
-

Kmacleod - WRInaute accro

- Messages: 3418
- Inscription: 28 Nov 2002
Comment pourrait on dire le contraire
Dans ton site il y a des liens style /forum/viewforum.html lequel pointe sur /forum/viewforum.php (par exemple)
mais le fichier physique est interdit par le Disallow
Enfin c'est ce que j'en comprends
Dans ton site il y a des liens style /forum/viewforum.html lequel pointe sur /forum/viewforum.php (par exemple)
mais le fichier physique est interdit par le Disallow
Enfin c'est ce que j'en comprends
- Mitirapa
- WRInaute passionné

- Messages: 1657
- Inscription: 10 Juil 2002
BDGest a écrit:Ben oui mais Google voit les fichiers viewforum.html et non viewforum.php ??? Donc si il demande le html, il s'en fout que derriere ce soit un php qui charge la page ? non ?
oui mais c'est le sereur qui donne... google demande le viewforum.html et le serveur donne SI IL A LE DROIT le viewforum.php
dans ton cas le serveur n'a pas donnée tes fichiers du forum
- BDGest
- WRInaute occasionnel

- Messages: 279
- Inscription: 6 Jan 2003
Ce n'est pas comme ça que je comprenais le fonctionnement d'un fichier robots.txt. Pour moi ce fichier est lu exclusivement par les robots (le serveur s'en fout) pour savoir où ils ont le droit de se ballader.
Quelqu'un peut confirmer ou infirmer ?
Quelqu'un peut confirmer ou infirmer ?
-

Kmacleod - WRInaute accro

- Messages: 3418
- Inscription: 28 Nov 2002
Dans ta problèmatique, il y a conflit entre les interdictions du robot et le .htaccess.
Si un fichier est dans le robot.txt, considère que pour Google il n'existe pas.
Même s'il lit le fichier .html, à un moment donné il faut bien qu'il aille lire le fichier.php, or le robot ne le veut pas.
Si un fichier est dans le robot.txt, considère que pour Google il n'existe pas.
Même s'il lit le fichier .html, à un moment donné il faut bien qu'il aille lire le fichier.php, or le robot ne le veut pas.
- BDGest
- WRInaute occasionnel

- Messages: 279
- Inscription: 6 Jan 2003
Kmacleod a écrit:Dans ta problèmatique, il y a conflit entre les interdictions du robot et le .htaccess.
Si un fichier est dans le robot.txt, considère que pour Google il n'existe pas.
Même s'il lit le fichier .html, à un moment donné il faut bien qu'il aille lire le fichier.php, or le robot ne le veut pas.
Ben non puisque le robot ne sait jamais qu'il demande un fichier html. C'est totalement trasnparent pour lui
-

Ben - WRInaute discret

- Messages: 217
- Inscription: 20 Fév 2003
Re: Full crawl trés incomplet
BDGest a écrit:Ce mois ci, google à complètement oublié une partie de mon site (le forum) lors du full crawl alors que le mois dernier, il était bien passé partout. Voici mon fichier robots.txt que j'ai mis en place suite à l'url rewriting.
Ton fichier robots.txt a l'air correct, le full crawl n'est pas encore fini je pense, il passera peut etre encore dans ton forum.
Je peux me tromper mais je pense qu'il doit y avoir un delai avant que les nouveaux liens soient pris en compte, j'imagine que google se base encore sur les anciens liens vers ton forum pour crawler a la recherche de nouvelles pages (mais il ne le fait pas a cause du robots.txt). Si il ne les prends pas a ce full crawl il les prendra sans doute au prochain...
Ben
11 messages
• Page 1 sur 1
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
Consultez la description détaillée des produits ou services de Google suivants : Google Webmaster Tools
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités

