Trop de restriction dans le robots.txt
Règles du forum
Attention ce forum est destiné avant tout à ceux qui découvrent le référencement. Les membres qui auront l'amabilité de répondre à leurs questions sont priés de rester courtois, polis, indulgents, patients et pédagogues... Merci d'avance !
Par ailleurs, inutile d'utiliser ce forum uniquement pour obtenir des liens vers vos sites, les liens sont désactivés pour le référencement (nofollow).
Attention ce forum est destiné avant tout à ceux qui découvrent le référencement. Les membres qui auront l'amabilité de répondre à leurs questions sont priés de rester courtois, polis, indulgents, patients et pédagogues... Merci d'avance !
Par ailleurs, inutile d'utiliser ce forum uniquement pour obtenir des liens vers vos sites, les liens sont désactivés pour le référencement (nofollow).
12 messages
• Page 1 sur 1
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
- dreadstock
- WRInaute occasionnel

- Messages: 257
- Inscription: 3 Fév 2009
Trop de restriction dans le robots.txt
Bonjour à tous,
J'ai un problème de duplicate content, que je n'arrive pas à résoudre avec les redirections, ma dernière solution est donc de mettre toutes les urls que je ne veux pas indexer dans le robots.txt
Exemple :
http://www.example.com/ville/12.html
http://www.example.com/ville/13.html
http://www.example.com/ville/14.html
http://www.example.com/ville/15.html
http://www.example.com/ville/16.html
http://www.example.com/ville/17.html
http://www.example.com/ville/18.html
J'ai au moins 500 liens à mettre dans le robot txt.
J'aurais pu faire : Disallow: /ville/ mais c'est pas possible, car la page que je souhaite indexer dans GG est http://www.example.com/ville/12-appartement-a-vendre-en-paca/
Voila. Etant donné que c'est la seule solution que j'ai trouvé (du moins pour mes petites compétences en dév), pensez vous que mettre autant d"url dans le robot ne va pas me pénaliser vis à vis de GG ? Par ailleurs, si quelqu'un à une autre solution, je suis preneur.
Pour info : la balise rel-canonical, j'ai essayé, je travaille avec joomla, je peux pas, le htaccess, je vois pas comment, la redirection 301 directe dans la page , je peux pas à cause de joomla
Merci par avance
J'ai un problème de duplicate content, que je n'arrive pas à résoudre avec les redirections, ma dernière solution est donc de mettre toutes les urls que je ne veux pas indexer dans le robots.txt
Exemple :
http://www.example.com/ville/12.html
http://www.example.com/ville/13.html
http://www.example.com/ville/14.html
http://www.example.com/ville/15.html
http://www.example.com/ville/16.html
http://www.example.com/ville/17.html
http://www.example.com/ville/18.html
J'ai au moins 500 liens à mettre dans le robot txt.
J'aurais pu faire : Disallow: /ville/ mais c'est pas possible, car la page que je souhaite indexer dans GG est http://www.example.com/ville/12-appartement-a-vendre-en-paca/
Voila. Etant donné que c'est la seule solution que j'ai trouvé (du moins pour mes petites compétences en dév), pensez vous que mettre autant d"url dans le robot ne va pas me pénaliser vis à vis de GG ? Par ailleurs, si quelqu'un à une autre solution, je suis preneur.
Pour info : la balise rel-canonical, j'ai essayé, je travaille avec joomla, je peux pas, le htaccess, je vois pas comment, la redirection 301 directe dans la page , je peux pas à cause de joomla
Merci par avance
Dernière édition par dreadstock le Lun Déc 20, 2010 15:43, édité 1 fois.
-

UsagiYojimbo - WRInaute accro

- Messages: 8579
- Inscription: 23 Nov 2005
Re: Trop de restriction dans le robots.txt
Pourquoi ne pas mettre la meta robots à noindex,follow dans les pages que tu ne veux pas indexer ?
- dreadstock
- WRInaute occasionnel

- Messages: 257
- Inscription: 3 Fév 2009
Re: Trop de restriction dans le robots.txt
UsagiYojimbo a écrit:Pourquoi ne pas mettre la meta robots à noindex,follow dans les pages que tu ne veux pas indexer ?
Oui j'y avait aussi pensé, mais je travaille avec joomla et je ne crois pas qu'il soit possible de modifier les pages unes par unes.
- dreadstock
- WRInaute occasionnel

- Messages: 257
- Inscription: 3 Fév 2009
Re: Trop de restriction dans le robots.txt
Madrileño a écrit:Il existe des URL prévues pour donner des exemples: "example.com" ou encore "example.net" (avec un "a").
Merci, mais je ne comprends pas bien pourquoi utiliser cela ?
-

Leonick - WRInaute accro

- Messages: 19598
- Inscription: 8 Aoû 2004
Re: Trop de restriction dans le robots.txt
pour éviter de faire des BL gratos à monsite qui existe aussi bien en .fr (renvoie sur les pagesjaunes) qu'en .comdreadstock a écrit:Merci, mais je ne comprends pas bien pourquoi utiliser cela ?
- dreadstock
- WRInaute occasionnel

- Messages: 257
- Inscription: 3 Fév 2009
Re: Trop de restriction dans le robots.txt
A bien vu , je ne connaissais pas ! merci /
-

UsagiYojimbo - WRInaute accro

- Messages: 8579
- Inscription: 23 Nov 2005
Re: Trop de restriction dans le robots.txt
dreadstock a écrit:UsagiYojimbo a écrit:Pourquoi ne pas mettre la meta robots à noindex,follow dans les pages que tu ne veux pas indexer ?
Oui j'y avait aussi pensé, mais je travaille avec joomla et je ne crois pas qu'il soit possible de modifier les pages unes par unes.
C'est un CMS, c'est le genre de problématique qu'ils gèrent, que ce soit en natif ou en utilisant de bons plugins.
Genre : http://extensions.joomla.org/extensions/site-management/seo-a-metadata/7124
- dreadstock
- WRInaute occasionnel

- Messages: 257
- Inscription: 3 Fév 2009
Re: Trop de restriction dans le robots.txt
Malheureusement l'extension ne me permet pas de faire cela.
Je vais être obligé de mettre mes 500 liens dans le robots.txt. J'espère que ca pas gêner google bot. Avez vous une idée ?
Merci
Je vais être obligé de mettre mes 500 liens dans le robots.txt. J'espère que ca pas gêner google bot. Avez vous une idée ?
Merci
- dreadstock
- WRInaute occasionnel

- Messages: 257
- Inscription: 3 Fév 2009
Re: Trop de restriction dans le robots.txt
Oh j'ai pire, après vérification, c'est bien plus grave que prévu. derrière l'ID je peux mettre n'importe quoi cela ramène à chaque fois sur le même bien. J'ai jamais vu ca.
Exemple le même bien est accessible sur les urls suivantes :
www.example.com/ville1/21.html
www.exemple.com/ville1/region1/21.html
www.exemple.com/ville2/region2/21.html
www.example.com/ville1/21
www.exemple.com/ville1/region1/21
www.exemple.com/ville2/region2/21
et en mettant n"importe quoi derrière le 21 example :
www.example.com/ville1/21^poiuy
www.exemple.com/ville1/region1/21lkjh
www.exemple.com/ville2/region2/21fglkj
ca pour chaque bien. Autant vous dire que je suis mal .
Exemple le même bien est accessible sur les urls suivantes :
www.example.com/ville1/21.html
www.exemple.com/ville1/region1/21.html
www.exemple.com/ville2/region2/21.html
www.example.com/ville1/21
www.exemple.com/ville1/region1/21
www.exemple.com/ville2/region2/21
et en mettant n"importe quoi derrière le 21 example :
www.example.com/ville1/21^poiuy
www.exemple.com/ville1/region1/21lkjh
www.exemple.com/ville2/region2/21fglkj
ca pour chaque bien. Autant vous dire que je suis mal .
- dreadstock
- WRInaute occasionnel

- Messages: 257
- Inscription: 3 Fév 2009
Re: Trop de restriction dans le robots.txt
UsagiYojimbo a écrit:dreadstock a écrit:UsagiYojimbo a écrit:Pourquoi ne pas mettre la meta robots à noindex,follow dans les pages que tu ne veux pas indexer ?
Oui j'y avait aussi pensé, mais je travaille avec joomla et je ne crois pas qu'il soit possible de modifier les pages unes par unes.
C'est un CMS, c'est le genre de problématique qu'ils gèrent, que ce soit en natif ou en utilisant de bons plugins.
Genre : http://extensions.joomla.org/extensions/site-management/seo-a-metadata/7124
Je te remercie cette solution est magnifique ! merci pour le composant !
12 messages
• Page 1 sur 1
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Restriction robots.txt
- Restriction : htaccess ou robots
- Restriction dans robots.txt mais toujours indexé
- Trop de scan des robots
- Trop d'impots, trop de taxes, trop de cotisations : partir à l'étranger ?
- TRop vieux ou trop impatient ? marre des doubles fenêtres
- Moteur de recherche référencement top trop bien trop fort
- Restriction compte Paypal
- Youtube et restriction de l'utilisation
- pb php basedir restriction
- Sortie de GoogleStats v2.01 - 02-03-2003
- Les crawlers de Yahoo! - 18-03-2004
- Du nouveau dans le Centre pour Webmasters de Live Search - 07-08-2008
- Les robots MSNbot de Live Search - 30-11-2006
- Outil commun WebRankInfo + Yagoort - 20-04-2005
- Déclarer son fichier sitemap dans le fichier robots.txt - 16-04-2007
- Petit changement pour Slurp (le robot de Yahoo) - 29-03-2007
- Bingbot : le nom officiel du robot de Bing - 29-06-2010
- Similarité et duplicate content
Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages). Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation... Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 1 invité


