google référence les parties qu'il ne dois pas de mon forum

Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics


aladdin
WRInaute passionné
WRInaute passionné
 
Messages: 925
Inscription: Ven Avr 29, 2005 12:26

google référence les parties qu'il ne dois pas de mon forum

Message le Dim Juil 31, 2005 11:17

j'ai suivi les topic sur l'url rewriting et le patch à appliquer à phpbb pour le féférencement, mais là, google référence aussi des parties qu'il ne devrai pas, car dans mon robots.txt j'ai ça
Code: Tout sélectionner
Disallow: sutra*.html$
Disallow: ptopic*.html$
Disallow: ntopic*.html$


et sur google, j'ai trouvé des page : sutre-##.html, ntopic-##.html ... ??


JeunZ
WRInaute accro
WRInaute accro
 
Messages: 5301
Inscription: Mer Fév 18, 2004 12:41

Message le Dim Juil 31, 2005 11:32

Met également du no follow sur ton forum ;-)


jeanluc
WRInaute accro
WRInaute accro
 
Messages: 2659
Inscription: Lun Mai 03, 2004 14:48

Message le Dim Juil 31, 2005 11:40

Bonjour aladdin,

Le problème est que, dans robots.txt, "*" ne veut pas dire n'importe quel caractère.

Code: Tout sélectionner
Disallow: /zut
interdit l'accès à tout ce qui commence par /zut, comme /zut.html ou /zut55.php?abc=34 ou /zut/abcd.php.

Dans ton exemple,
Code: Tout sélectionner
Disallow: sutra*.html$
interdit l'accès à ce qui commence par "sutra*.html$". :roll:

Jean-Luc
Dernière édition par jeanluc le Dim Juil 31, 2005 17:19, édité 1 fois.

shrom
WRInaute passionné
WRInaute passionné
 
Messages: 865
Inscription: Lun Juil 05, 2004 22:37

Message le Dim Juil 31, 2005 11:49

Tu auras beau interdire, Google continuera à indexer ces pages, c'est comme ça. Par contre, il n'affichera plus de titre ni de description. C'est la même chose pour le meta no-index.

Si une page est dans robots.txt, nous n'allons pas la crawler, mais nous pouvons l'afficher dans les résultats de recherche si nous avons des raisons de penser qu'elle est pertinente par rapport à la requête. Dans ce cas, nous n'afficherons que l'URL (pas de titre, pas de description et pas de cache). " ( GoogleGuy )


aladdin
WRInaute passionné
WRInaute passionné
 
Messages: 925
Inscription: Ven Avr 29, 2005 12:26

Message le Dim Juil 31, 2005 11:52

ok, donc si j'ai bien compris, je ne risque pas le "duplicate content" meme si ces pages sont crawler (vu que ni le titre ni la description ne sont pris en compte)

:)


jeanluc
WRInaute accro
WRInaute accro
 
Messages: 2659
Inscription: Lun Mai 03, 2004 14:48

Message le Dim Juil 31, 2005 14:39

Ton robots.txt tel qu'il est est inutile, car incorrect. Si tu le corriges, tu peux interdire à Google de visiter certaines URL.

Comme le dit shrom, même si Google ne visite pas une adresse, il sait qu'elle existe dès qu'il rencontre ailleurs un lien vers cette adresse. Google se permettra alors d'afficher cette adresse dans les résultats, mais sans jamais l'avoir visitée (uniquement sur base de l'URL de la page et des liens vers celle-ci).

Si Google crawle une page, il la lit et, tôt ou tard, il l'indexera sauf si elle contient une META "robots" avec "noindex".

Jean-Luc


aladdin
WRInaute passionné
WRInaute passionné
 
Messages: 925
Inscription: Ven Avr 29, 2005 12:26

Message le Dim Juil 31, 2005 19:53

j'ai verifié et google comprend bien la syntaxe ?!
Code: Tout sélectionner
Disallow: sutra*.html$


quelcun peut le confirmer plz ?


Formation recommandée sur ce thème :

Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :

Consultez la description détaillée des produits ou services de Google suivants : Google Web Accelerator

  • Calculer le ratio de liens profonds
    Cet outil vous permet de calculer le taux de liens profonds vers un site web. Un lien profond est un lien qui ne pointe pas vers la page d'accueil mais au contraire vers une page interne du site. Les sites dont l'essentiel du référencement vient de leurs inscriptions dans des annuaires ont un taux de liens profonds faible ; à l'inverse, les sites de référence ont souvent un taux de liens profonds plus important, signe que leur contenu a suscité de nombreux liens spontanés.


Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités