Full crawl trés incomplet
11 messages • Page 1 sur 1
Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics
Full crawl trés incomplet
Ce mois ci, google à complètement oublié une partie de mon site (le forum) lors du full crawl alors que le mois dernier, il était bien passé partout. Voici mon fichier robots.txt que j'ai mis en place suite à l'url rewriting. Vous croyez que cela peut venir de ça :
- Code: Tout sélectionner
User-agent: *
Disallow: /images/
Disallow: /old_forum/
Disallow: /old_forum_sav/
Disallow: /ftp/
Disallow: /images/
Disallow: /forum/login.php
Disallow: /forum/modcp.php
Disallow: /forum/posting.php
Disallow: /forum/privmsg.php
Disallow: /forum/search.php
Disallow: /forum/viewonline.php
Disallow: /forum/viewmessage
Disallow: /forum/viewforum.php
Disallow: /forum/viewtopic.php
Disallow: /forum/statistics.php
Disallow: /forum/site_hist.php
Disallow: /forum/profilephoto_mod.php
Disallow: /forum/profile.php
Disallow: /forum/memberlist.php
Disallow: /forum/ranking.php
Disallow: /forum/groupcp.php
Disallow: /forum/ranking.php
Comment pourrait on dire le contraire
Dans ton site il y a des liens style /forum/viewforum.html lequel pointe sur /forum/viewforum.php (par exemple)
mais le fichier physique est interdit par le Disallow
Enfin c'est ce que j'en comprends
Dans ton site il y a des liens style /forum/viewforum.html lequel pointe sur /forum/viewforum.php (par exemple)
mais le fichier physique est interdit par le Disallow
Enfin c'est ce que j'en comprends
BDGest a écrit:Ben oui mais Google voit les fichiers viewforum.html et non viewforum.php ??? Donc si il demande le html, il s'en fout que derriere ce soit un php qui charge la page ? non ?
oui mais c'est le sereur qui donne... google demande le viewforum.html et le serveur donne SI IL A LE DROIT le viewforum.php
dans ton cas le serveur n'a pas donnée tes fichiers du forum
Ce n'est pas comme ça que je comprenais le fonctionnement d'un fichier robots.txt. Pour moi ce fichier est lu exclusivement par les robots (le serveur s'en fout) pour savoir où ils ont le droit de se ballader.
Quelqu'un peut confirmer ou infirmer ?
Quelqu'un peut confirmer ou infirmer ?
Dans ta problèmatique, il y a conflit entre les interdictions du robot et le .htaccess.
Si un fichier est dans le robot.txt, considère que pour Google il n'existe pas.
Même s'il lit le fichier .html, à un moment donné il faut bien qu'il aille lire le fichier.php, or le robot ne le veut pas.
Si un fichier est dans le robot.txt, considère que pour Google il n'existe pas.
Même s'il lit le fichier .html, à un moment donné il faut bien qu'il aille lire le fichier.php, or le robot ne le veut pas.
Kmacleod a écrit:Dans ta problèmatique, il y a conflit entre les interdictions du robot et le .htaccess.
Si un fichier est dans le robot.txt, considère que pour Google il n'existe pas.
Même s'il lit le fichier .html, à un moment donné il faut bien qu'il aille lire le fichier.php, or le robot ne le veut pas.
Ben non puisque le robot ne sait jamais qu'il demande un fichier html. C'est totalement trasnparent pour lui
Re: Full crawl trés incomplet
BDGest a écrit:Ce mois ci, google à complètement oublié une partie de mon site (le forum) lors du full crawl alors que le mois dernier, il était bien passé partout. Voici mon fichier robots.txt que j'ai mis en place suite à l'url rewriting.
Ton fichier robots.txt a l'air correct, le full crawl n'est pas encore fini je pense, il passera peut etre encore dans ton forum.
Je peux me tromper mais je pense qu'il doit y avoir un delai avant que les nouveaux liens soient pris en compte, j'imagine que google se base encore sur les anciens liens vers ton forum pour crawler a la recherche de nouvelles pages (mais il ne le fait pas a cause du robots.txt). Si il ne les prends pas a ce full crawl il les prendra sans doute au prochain...
Ben
11 messages • Page 1 sur 1
Formation recommandée sur ce thème :
Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Le Full Crawl a enfin commencé
- Début du Full Crawl
- Le début du full crawl
- La vie d'une page sur le web : Fresh Crawl, Deep Crawl, Google Dance
- Explications sur le Crawl Caching Proxy de Google
- Petit changement pour Slurp (le robot de Yahoo)
- Etude de Googlebot, le robot crawler de Google (Fresh Bot, Deep Bot)
- L'algorithme de Google en résumé (mars 2003)
- Googlebot, le robot d'indexation de Google
- Du nouveau dans le Centre pour Webmasters de Live Search
- But du full crawl?
- Full Crawl
- Prochain full crawl
- Un full crawl... chinois :)
- Forcer un full crawl ...?
- Full crawl démarré !
- Inktomi full crawl ??
- Help : full crawl en googlestats
- Full crawl octobre 2004
- Full crawl ? [qui n'existe plus]
- pb dans l'alerte Full Crawl
- full crawl de janvier 2003
- Google dance / full crawl
- Semi full crawl de Yahoo Slurp
- Full Crawl et délais de mise a jour
Consultez la description détaillée des produits ou services de Google suivants : Google Webmaster Tools
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités






le forum