Disallow d'un site avec un port spécifique dans le fichier robot.txt
5 messages
• Page 1 sur 1
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
- johnnyAlternWeb
- Nouveau WRInaute

- Messages: 13
- Inscription: 24 Mai 2011
Disallow d'un site avec un port spécifique dans le fichier robot.txt
Bonjour,
Je n'arrive pas à trouver la réponse à mon problème plutôt technique;
J'ai un site qui est référencé sous son port de test avant synchronisation :
http://www.site.fr:8080
Il apparaît ensuite pour les clients sous http://site.fr/
Comment désindexer ce http://www.site.fr:8080 dans le robot.txt du dossier ?
Est ce que cette syntaxe fonctionne et sans risque pour les pages en www.site.fr (on fait 15000 visites par jours donc je n'ai pas le droit à l’erreur) :
Merci
Je n'arrive pas à trouver la réponse à mon problème plutôt technique;
J'ai un site qui est référencé sous son port de test avant synchronisation :
http://www.site.fr:8080
Il apparaît ensuite pour les clients sous http://site.fr/
Comment désindexer ce http://www.site.fr:8080 dans le robot.txt du dossier ?
Est ce que cette syntaxe fonctionne et sans risque pour les pages en www.site.fr (on fait 15000 visites par jours donc je n'ai pas le droit à l’erreur) :
- User-agent: *
Disallow: site.fr:8080
Merci
-

forty - WRInaute passionné

- Messages: 1701
- Inscription: 30 Oct 2008
Re: Disallow d'un site avec un port spécifique dans le fichier robot.txt
je mettrais dans le fichier visible à l'adresse : http://www.site.fr:8080/robots.txt :
L'idéal c'est quand même de mettre une protection par mot de passe pour éviter les indexations par erreur de versions de test.
- Code: Tout sélectionner
User-agent: *
Disallow: /
L'idéal c'est quand même de mettre une protection par mot de passe pour éviter les indexations par erreur de versions de test.
- johnnyAlternWeb
- Nouveau WRInaute

- Messages: 13
- Inscription: 24 Mai 2011
Re: Disallow d'un site avec un port spécifique dans le fichier robot.txt
forty a écrit:je mettrais dans le fichier visible à l'adresse : http://www.site.fr:8080/robots.txt :
- Code: Tout sélectionner
User-agent: *
Disallow: /
L'idéal c'est quand même de mettre une protection par mot de passe pour éviter les indexations par erreur de versions de test.
Merci, le problème c'est que ce fichier robots.txt sera ensuite envoyer lors de la prochaine synchronisation vers nos serveurs "client". Donc désindexera tout notre site. Je pense qu'il faut que je cherche au niveau du serveur. www.site.fr:8080 et www.site.fr sont identiques et donc sur un seul répertoire.
D'après ce que l'équipe technique m'a expliqué, les développeurs mettent leurs travaux finis sur www.site.fr:8080 font une synchronisation pour injecter les fichiers sur les trois serveur et les clients sont dirigés vers le www.site.fr:8181, www.site.fr:8282 et www.site.fr:8383 de façon transparente et en fonction de la charge.
-

forty - WRInaute passionné

- Messages: 1701
- Inscription: 30 Oct 2008
Re: Disallow d'un site avec un port spécifique dans le fichier robot.txt
tu peux essayer avec une règle de réécriture qui affiche un autre robots.txt si le port est 8080 :
- Code: Tout sélectionner
RewriteEngine On
RewriteCond %{SERVER_PORT} ^8080$
RewriteRule ^robots\.txt$ /robots_8080.txt [L]
- johnnyAlternWeb
- Nouveau WRInaute

- Messages: 13
- Inscription: 24 Mai 2011
Re: Disallow d'un site avec un port spécifique dans le fichier robot.txt
forty a écrit:tu peux essayer avec une règle de réécriture qui affiche un autre robots.txt si le port est 8080 :
- Code: Tout sélectionner
RewriteEngine On
RewriteCond %{SERVER_PORT} ^8080$
RewriteRule ^robots\.txt$ /robots_8080.txt [L]
Merci, on va essayer !
5 messages
• Page 1 sur 1
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Problèmes Robot.txt pour disallow des pages
- robot.txt - Disallow - google conserve les backlink ?
- Mettre une page en Disallow ou pas dans robot.txt ?
- Robot.txt et Disallow un dossier mais pas tous ses sous dossiers ?
- fichier robot.txt
- fichier robot.txt et worpress
- robots.txt : Disallow des pages sport-xxxx.html sans Disallow de sport-equestre.html
- mon fichier robot.txt
- Joomla et le fichier robot.txt
- Fichier robot ou autre astuce
Consultez la description détaillée des produits ou services de Google suivants : Google Feed Fetcher, Googlebot
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités
