Saturation Google dû à l'URL Rewriting
24 messages
• Page 1 sur 2 • 1, 2
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
-

Yvan - WRInaute occasionnel

- Messages: 295
- Inscription: 6 Nov 2002
Saturation Google dû à l'URL Rewriting
Bonjour, je poste ça ici, mais ça devrait aussi se trouver dans la section URL Rewriting.
Voilà, mon site utilise l'URL Rewriting, et ça marche enfin parfaitement, enfin je veux dire par là que Google m'a enfin référencé, tout au moins il a bien commencé (merci Googlestats pour les infos !), et ce malgré mes Frames (au passage pour ceux qui en ont, gardez-les !).
Cependant, j'ai une page de recherche : http://www.lacoccinelle.net/search.html, et dessus j'y affiche les 20 dernières recherches. Google en a déjà pris un paquet de 20. Mais à chaque fois qu'il va passer, il va tomber sur une nouvelle version de la page de recherche, donc sur 20 nouvelles URL... Et sachant qu'elles sont toutes réécrites... Ca ne va pas être très propre tout ça, puisqu'il ne va pas arrêter de trouver des pages, et qu'il va sans arrêt les ajouter à son index. Pour moi, pas de problème, mais pour Google, cela ne risque-t-il pas d'être du temps perdu/place perdue ? Parce qu'il n'est pas près de voir toutes les URL possibles, même si derrière leur contenu change peu souvent. Et j'ai aussi un peu peur de voir mes stats saturées par GoogleBot...
Des idées/infos là-dessus, ou le mieux est-il encore de poser la question au concerné (donc à la Google équipe !) ?
Yvan.
Voilà, mon site utilise l'URL Rewriting, et ça marche enfin parfaitement, enfin je veux dire par là que Google m'a enfin référencé, tout au moins il a bien commencé (merci Googlestats pour les infos !), et ce malgré mes Frames (au passage pour ceux qui en ont, gardez-les !).
Cependant, j'ai une page de recherche : http://www.lacoccinelle.net/search.html, et dessus j'y affiche les 20 dernières recherches. Google en a déjà pris un paquet de 20. Mais à chaque fois qu'il va passer, il va tomber sur une nouvelle version de la page de recherche, donc sur 20 nouvelles URL... Et sachant qu'elles sont toutes réécrites... Ca ne va pas être très propre tout ça, puisqu'il ne va pas arrêter de trouver des pages, et qu'il va sans arrêt les ajouter à son index. Pour moi, pas de problème, mais pour Google, cela ne risque-t-il pas d'être du temps perdu/place perdue ? Parce qu'il n'est pas près de voir toutes les URL possibles, même si derrière leur contenu change peu souvent. Et j'ai aussi un peu peur de voir mes stats saturées par GoogleBot...
Des idées/infos là-dessus, ou le mieux est-il encore de poser la question au concerné (donc à la Google équipe !) ?
Yvan.
-

WebRankInfo - Administrateur du site

- Messages: 19420
- Inscription: 19 Avr 2002
tu peux interdire à Google d'indexer cette page précisément, avec la balise meta robots
-

Yvan - WRInaute occasionnel

- Messages: 295
- Inscription: 6 Nov 2002
Oui, c'est vrai, j'avais pas pensé à ça... Mais la question est aussi : est-il utile que Google référence ces pages, qui ne sont qu'un mix de mes autres pages ? Je me dis que oui puisque cela me permettra d'avoir plus de pages, donc plus de pages avec mots-clé, mais comment Google pourra-t-il faire la différence avec des pages satellites ?
Sinon je sens que je vais opté pour le "noindex", parce que maintenant qu'il commence à suivre mes urls, j'ai aps envie de me faire blacklister !!
Merci,
Yvan.
Sinon je sens que je vais opté pour le "noindex", parce que maintenant qu'il commence à suivre mes urls, j'ai aps envie de me faire blacklister !!
Merci,
Yvan.
- champignac
- WRInaute discret

- Messages: 55
- Inscription: 13 Déc 2002
Pour infos, avant d'arriver a satturer google tu peux y aller !
Le mois dernier a cause de ( ou grace a ) l'url rewritting, google m'a référencé 55000 pages sans problèmes. Aucune utilitée ( ou trés peu en terme de trafic ), si ce n'est des erreurs du a certain bug de prog.
Pour information seulement.
Le mois dernier a cause de ( ou grace a ) l'url rewritting, google m'a référencé 55000 pages sans problèmes. Aucune utilitée ( ou trés peu en terme de trafic ), si ce n'est des erreurs du a certain bug de prog.
Pour information seulement.
- Mitirapa
- WRInaute passionné

- Messages: 1657
- Inscription: 10 Juil 2002
perso au début je voulais qu'il en prenne un max.. il a meme été à 142 000 pages indexés (j'avais fait une erreur de SID dans mon forum)
maintenant que j'ai vu le taux de visiteurs rammené par rapport ma bande passante bouffée, j'ai préféré à fermer mes forums pour le non-membre (et donc les moteurs vu qu'ils ne sont pas membre), et je vais aussi virer mon url rewriting d'une partie de ma galerie photos...
Ma conclusion de mon expérience a donc été de savoir que ca ne sert à rien de rendre tout indexable...
maintenant que j'ai vu le taux de visiteurs rammené par rapport ma bande passante bouffée, j'ai préféré à fermer mes forums pour le non-membre (et donc les moteurs vu qu'ils ne sont pas membre), et je vais aussi virer mon url rewriting d'une partie de ma galerie photos...
Ma conclusion de mon expérience a donc été de savoir que ca ne sert à rien de rendre tout indexable...
- Dams
- WRInaute discret

- Messages: 193
- Inscription: 10 Mar 2003
Mitirapa a écrit:maintenant que j'ai vu le taux de visiteurs rammené par rapport ma bande passante bouffée, j'ai préféré à fermer mes forums pour le non-membre
Que veux tu dire ? Que ta bande passante a été bouffée à cause d'un trop grand nombre de visiteur ? Dans se cas c'est bien, non ?
- Katia
- WRInaute occasionnel

- Messages: 471
- Inscription: 4 Sep 2002
Bande passante...
C'est sûr que pour les sites qui se laissent accaparer progressivement la totalité de leur bande passante par les spiders, il faudrait inventer une nouvelle balise du type:
<META NAME="Humans" CONTENT="indexation en cours, Désolé nofollow">
Mitirapa a écrit:bouffé par les robots des moteurs...
googlebot+pompos+fast, etc.. ca fait bcp de traffic par ces bots pour pas bcp de retour de vrais visiteurs
C'est sûr que pour les sites qui se laissent accaparer progressivement la totalité de leur bande passante par les spiders, il faudrait inventer une nouvelle balise du type:
<META NAME="Humans" CONTENT="indexation en cours, Désolé nofollow">
-

Yvan - WRInaute occasionnel

- Messages: 295
- Inscription: 6 Nov 2002
Bonjour, je rentre juste de WE, et la surprise, c'est aussi les 4000 mails de Google Stats !! Et oui, le problème n'est pas seulement que Google m'indexe les pages, mais comme le dit Mitirapa, c'est que ça bouffe de la bande-passante au max. De plus, si je laisse faire Google, il n'en finira pas de trouver des pages (car les recherches réalisées sur mon site font parties des URL !). Donc forcément, il me faut le limiter. Je sais bien que je ne risque pas de les saturer, mais bon, j'ai déjà 4000 pages indexes, alors que seulement 600 suffiraient. J'ai donc mis un noindex/nofollow sur ma page de recherche. En sachant cependant que mes pages restent accessibles par d'autres liens.
Une question me vient : si Google référence une page, mais ne suit pas les liens (à cause du "nofollow"), se servira-t-il tout de même de cette page pour calculer son PR ? En clair s'il voit un lien d'une page A (nofollow) vers une page B déjà indexée, l'inclut-il dans son algorithme pour calculer le PR de B ?
C'est tout sinon, merci de vos réponses
Une question me vient : si Google référence une page, mais ne suit pas les liens (à cause du "nofollow"), se servira-t-il tout de même de cette page pour calculer son PR ? En clair s'il voit un lien d'une page A (nofollow) vers une page B déjà indexée, l'inclut-il dans son algorithme pour calculer le PR de B ?
C'est tout sinon, merci de vos réponses
-

WebRankInfo - Administrateur du site

- Messages: 19420
- Inscription: 19 Avr 2002
pour le pb de GoogleStats (même s'il y aura sûrement une nouvelle version d'ici la prochaine Google Dance) :
1/ dans googlestats.inc.php : cherche les lignes ressemblant à ça :
2/ pour éviter de recevoir un message sans texte (
), toujours dans le meme fichier, ajoute en haut :
ceci dit apparement GoogleBot aime bien ton site !
1/ dans googlestats.inc.php : cherche les lignes ressemblant à ça :
- Code: Tout sélectionner
$sql3 .= " WHERE ip LIKE '".$FULL_CRAWL_IP."%'";
$sql3 .= " AND TO_DAYS(NOW()) - TO_DAYS(date) < $NB_J_DET_FULL_CRAWL";
2/ pour éviter de recevoir un message sans texte (
- Code: Tout sélectionner
include $DOCUMENT_ROOT."/googlestats/lang.$LANGUE.php";
ceci dit apparement GoogleBot aime bien ton site !
-

Yvan - WRInaute occasionnel

- Messages: 295
- Inscription: 6 Nov 2002
Salut Olivier, je n'ai pas vu de différence entre le code sql3 du script que j'ai et de celui que tu as posté. Ca doit limiter le nombre de mail que je reçois, c'est ça ?D'après ce que j'ai compris, ça ne limite pas, et ça m'envoie un mail par page sur laquelle le Full Crawl est passé. C'est pas bien grave, j'ai encore plus limité mes pages grâce au noindex/nofollow, je ne devrais plus recevoir de mails. Et de toute façon, je les laisse, ça me permet de voir l'activité de mon cher GoogleBot.
Quant au $LANGUE, je le savais, puisque c'est moi qui t'ai fait passé le mot
Mais je ne regrette en rien cette toute dernière version de GS, au contraire, ça m'a permi de voir que Google et les autres moteurs risquaient de tourner en rond sur mon site...
A plus, et merci encore de ta spontanéité !
Quant au $LANGUE, je le savais, puisque c'est moi qui t'ai fait passé le mot
Mais je ne regrette en rien cette toute dernière version de GS, au contraire, ça m'a permi de voir que Google et les autres moteurs risquaient de tourner en rond sur mon site...
A plus, et merci encore de ta spontanéité !
-

WebRankInfo - Administrateur du site

- Messages: 19420
- Inscription: 19 Avr 2002
il y avait une parenthèse en trop après ."%'";
- Katia
- WRInaute occasionnel

- Messages: 471
- Inscription: 4 Sep 2002
Yvan a écrit:Une question me vient : si Google référence une page, mais ne suit pas les liens (à cause du "nofollow"), se servira-t-il tout de même de cette page pour calculer son PR ? En clair s'il voit un lien d'une page A (nofollow) vers une page B déjà indexée, l'inclut-il dans son algorithme pour calculer le PR de B ?
Juste pour dire que la réponse à cette question m'intéresse également...même si il y a peu de change que quelqu'un soit informé. C'est très proche de http://www.webrankinfo.com/forums/viewtopic_2079.htm resté sans réponse.
Katia.
-

Yvan - WRInaute occasionnel

- Messages: 295
- Inscription: 6 Nov 2002
Katia, je pense que le plus simple reste encore de demander à l'équipe de Google. Si j'ai le temps, je le ferais ce soir.
Olivier, j'ai trouvé la parenthèse fautive en effet, par contre je ne vois pas ce que cela pourrait changer au niveau des mails (bien que la requête MySQL marche désormais). Si j'ai bien compris, on reçoit un mail par page crawlée par le Full Crawl, c'est bien ça ?
A plus,
Olivier, j'ai trouvé la parenthèse fautive en effet, par contre je ne vois pas ce que cela pourrait changer au niveau des mails (bien que la requête MySQL marche désormais). Si j'ai bien compris, on reçoit un mail par page crawlée par le Full Crawl, c'est bien ça ?
A plus,
24 messages
• Page 1 sur 2 • 1, 2
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- nettoyer des URL de la base Google apres url rewriting
- Supprimer de google mes anciennes URL (après URL rewriting)
- Anciennes URL dans Google après url rewriting
- Url Rewriting et google
- Google sitemap et url rewriting
- URL Rewriting, Multilangue et google
- google et mon url rewriting
- URL Rewriting et google ... Bizarre !
- sitemap generator de google et url rewriting
- Problème URL Rewriting et indexation Google
Consultez la description détaillée des produits ou services de Google suivants : Google goo.gl
- Calcul du nombre de backlinks
Cet outil vous permet d'analyser en détails la "popularité" de votre site sur Google. En plus du nombre de liens pris en compte par Google, il calcule le pourcentage de liens internes parmi tous les liens, et il affiche les premières URL trouvées. - Transformer des citations en liens
Cet outil vous permet de trouver des pages citant votre site mais ne faisant pas (encore) de lien. Il suffira parfois d'un simple mail pour transformer cette simple citation en lien (backlink).
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités
