Trop de restriction dans le robots.txt

Règles du forum
Attention ce forum est destiné avant tout à ceux qui découvrent le référencement. Les membres qui auront l'amabilité de répondre à leurs questions sont priés de rester courtois, polis, indulgents, patients et pédagogues... Merci d'avance !

Par ailleurs, inutile d'utiliser ce forum uniquement pour obtenir des liens vers vos sites, les liens sont désactivés pour le référencement (nofollow).

Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics

dreadstock
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 257
Inscription: 3 Fév 2009

Trop de restriction dans le robots.txt

Message le Lun Déc 20, 2010 11:06

Bonjour à tous,

J'ai un problème de duplicate content, que je n'arrive pas à résoudre avec les redirections, ma dernière solution est donc de mettre toutes les urls que je ne veux pas indexer dans le robots.txt
Exemple :

http://www.example.com/ville/12.html
http://www.example.com/ville/13.html
http://www.example.com/ville/14.html
http://www.example.com/ville/15.html
http://www.example.com/ville/16.html
http://www.example.com/ville/17.html
http://www.example.com/ville/18.html

J'ai au moins 500 liens à mettre dans le robot txt.
J'aurais pu faire : Disallow: /ville/ mais c'est pas possible, car la page que je souhaite indexer dans GG est http://www.example.com/ville/12-appartement-a-vendre-en-paca/

Voila. Etant donné que c'est la seule solution que j'ai trouvé (du moins pour mes petites compétences en dév), pensez vous que mettre autant d"url dans le robot ne va pas me pénaliser vis à vis de GG ? Par ailleurs, si quelqu'un à une autre solution, je suis preneur.
Pour info : la balise rel-canonical, j'ai essayé, je travaille avec joomla, je peux pas, le htaccess, je vois pas comment, la redirection 301 directe dans la page , je peux pas à cause de joomla

Merci par avance
Dernière édition par dreadstock le Lun Déc 20, 2010 15:43, édité 1 fois.


Madrileño
Madrileño
Madrileño
 
Messages: 28414
Inscription: 7 Juil 2004

Re: Trop de restriction dans le robots.txt

Message le Lun Déc 20, 2010 14:10

Il existe des URL prévues pour donner des exemples: "example.com" ou encore "example.net" (avec un "a").


UsagiYojimbo
WRInaute accro
WRInaute accro
 
Messages: 8579
Inscription: 23 Nov 2005

Re: Trop de restriction dans le robots.txt

Message le Lun Déc 20, 2010 14:13

Pourquoi ne pas mettre la meta robots à noindex,follow dans les pages que tu ne veux pas indexer ?

dreadstock
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 257
Inscription: 3 Fév 2009

Re: Trop de restriction dans le robots.txt

Message le Lun Déc 20, 2010 15:20

UsagiYojimbo a écrit:Pourquoi ne pas mettre la meta robots à noindex,follow dans les pages que tu ne veux pas indexer ?

Oui j'y avait aussi pensé, mais je travaille avec joomla et je ne crois pas qu'il soit possible de modifier les pages unes par unes.

dreadstock
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 257
Inscription: 3 Fév 2009

Re: Trop de restriction dans le robots.txt

Message le Lun Déc 20, 2010 15:24

Madrileño a écrit:Il existe des URL prévues pour donner des exemples: "example.com" ou encore "example.net" (avec un "a").

Merci, mais je ne comprends pas bien pourquoi utiliser cela ?


Leonick
WRInaute accro
WRInaute accro
 
Messages: 19598
Inscription: 8 Aoû 2004

Re: Trop de restriction dans le robots.txt

Message le Lun Déc 20, 2010 15:38

dreadstock a écrit:Merci, mais je ne comprends pas bien pourquoi utiliser cela ?
pour éviter de faire des BL gratos à monsite qui existe aussi bien en .fr (renvoie sur les pagesjaunes) qu'en .com

dreadstock
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 257
Inscription: 3 Fév 2009

Re: Trop de restriction dans le robots.txt

Message le Lun Déc 20, 2010 15:44

A bien vu , je ne connaissais pas ! merci /


UsagiYojimbo
WRInaute accro
WRInaute accro
 
Messages: 8579
Inscription: 23 Nov 2005

Re: Trop de restriction dans le robots.txt

Message le Lun Déc 20, 2010 17:25

dreadstock a écrit:
UsagiYojimbo a écrit:Pourquoi ne pas mettre la meta robots à noindex,follow dans les pages que tu ne veux pas indexer ?

Oui j'y avait aussi pensé, mais je travaille avec joomla et je ne crois pas qu'il soit possible de modifier les pages unes par unes.


C'est un CMS, c'est le genre de problématique qu'ils gèrent, que ce soit en natif ou en utilisant de bons plugins.

Genre : http://extensions.joomla.org/extensions/site-management/seo-a-metadata/7124

dreadstock
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 257
Inscription: 3 Fév 2009

Re: Trop de restriction dans le robots.txt

Message le Mar Déc 21, 2010 15:39

Malheureusement l'extension ne me permet pas de faire cela.

Je vais être obligé de mettre mes 500 liens dans le robots.txt. J'espère que ca pas gêner google bot. Avez vous une idée ?

Merci


cedric_g
WRInaute accro
WRInaute accro
 
Messages: 3552
Inscription: 18 Jan 2006

Re: Trop de restriction dans le robots.txt

Message le Mar Déc 21, 2010 15:43

Et euh... filtrer dans ton robots.txt les URL répondant à /ville/*.html ?

dreadstock
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 257
Inscription: 3 Fév 2009

Re: Trop de restriction dans le robots.txt

Message le Mar Déc 21, 2010 16:23

Oh j'ai pire, après vérification, c'est bien plus grave que prévu. derrière l'ID je peux mettre n'importe quoi cela ramène à chaque fois sur le même bien. J'ai jamais vu ca.

Exemple le même bien est accessible sur les urls suivantes :

www.example.com/ville1/21.html
www.exemple.com/ville1/region1/21.html
www.exemple.com/ville2/region2/21.html

www.example.com/ville1/21
www.exemple.com/ville1/region1/21
www.exemple.com/ville2/region2/21

et en mettant n"importe quoi derrière le 21 example :
www.example.com/ville1/21^poiuy
www.exemple.com/ville1/region1/21lkjh
www.exemple.com/ville2/region2/21fglkj

ca pour chaque bien. Autant vous dire que je suis mal .

dreadstock
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 257
Inscription: 3 Fév 2009

Re: Trop de restriction dans le robots.txt

Message le Jeu Déc 23, 2010 11:32

UsagiYojimbo a écrit:
dreadstock a écrit:
UsagiYojimbo a écrit:Pourquoi ne pas mettre la meta robots à noindex,follow dans les pages que tu ne veux pas indexer ?

Oui j'y avait aussi pensé, mais je travaille avec joomla et je ne crois pas qu'il soit possible de modifier les pages unes par unes.


C'est un CMS, c'est le genre de problématique qu'ils gèrent, que ce soit en natif ou en utilisant de bons plugins.

Genre : http://extensions.joomla.org/extensions/site-management/seo-a-metadata/7124



Je te remercie cette solution est magnifique ! merci pour le composant !


Si vous avez aimé cette discussion, partagez-la sur vos réseaux sociaux préférés :

Formation recommandée sur ce thème :

Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :

  • Similarité et duplicate content
    Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages). Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation... Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués.


Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 1 invité