Mon fichier robots.txt laisse-t-il passer ia_archiver ?
7 messages
• Page 1 sur 1
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
-

ortolojf - WRInaute passionné

- Messages: 1674
- Inscription: 14 Aoû 2002
Mon fichier robots.txt laisse-t-il passer ia_archiver ?
Bonsoir
Il semble, que le robot ia_archiver scanne encore les sites, donc le site archive.org devrait encore archiver des sites.
La dernière visite de ce bot ia_archiver , date du 9 Novembre 2009, il a aspiré mon fichier robots.txt
Voici ce que ce fichier robots.txt contenait ( et contient encore ), merci de me dire s'il accorde à ce site archiver.org , la possibilité d'archiver mon site ( c'est ce que je souhaite ).
User-agent: *
Disallow: /images/
Disallow: /music/
Disallow: /php/xrvftsvryf/
Disallow: /php/xrvftsvryf/pxvrfzvrt/
Disallow: /php/courses_nouvelles/manual/
Merci beaucoup de vos réponses.
Amicalement.
Jean-François Ortolo
Il semble, que le robot ia_archiver scanne encore les sites, donc le site archive.org devrait encore archiver des sites.
La dernière visite de ce bot ia_archiver , date du 9 Novembre 2009, il a aspiré mon fichier robots.txt
Voici ce que ce fichier robots.txt contenait ( et contient encore ), merci de me dire s'il accorde à ce site archiver.org , la possibilité d'archiver mon site ( c'est ce que je souhaite ).
User-agent: *
Disallow: /images/
Disallow: /music/
Disallow: /php/xrvftsvryf/
Disallow: /php/xrvftsvryf/pxvrfzvrt/
Disallow: /php/courses_nouvelles/manual/
Merci beaucoup de vos réponses.
Amicalement.
Jean-François Ortolo
-

jeanluc - WRInaute accro

- Messages: 3062
- Inscription: 3 Mai 2004
Re: Mon fichier robots.txt laisse-t-il passer ia_archiver ?
Ce robots.txt bloque l'accès de tous les robots aux quelques répertoires indiqués. Tous les autres répertoires sont accessibles à ia_archiver, Google et compagnie.
Entre parenthèses, quand un répertoire est bloqué, ses sous-répertoires sont automatiquement bloqués également. Comme tu as
Jean-Luc
Entre parenthèses, quand un répertoire est bloqué, ses sous-répertoires sont automatiquement bloqués également. Comme tu as
- Code: Tout sélectionner
Disallow: /php/xrvftsvryf/
- Code: Tout sélectionner
Disallow: /php/xrvftsvryf/pxvrfzvrt/
Jean-Luc
-

ortolojf - WRInaute passionné

- Messages: 1674
- Inscription: 14 Aoû 2002
Re: Mon fichier robots.txt laisse-t-il passer ia_archiver ?
jeanluc a écrit:Ce robots.txt bloque l'accès de tous les robots aux quelques répertoires indiqués. Tous les autres répertoires sont accessibles à ia_archiver, Google et compagnie.
Entre parenthèses, quand un répertoire est bloqué, ses sous-répertoires sont automatiquement bloqués également. Comme tu asil n'est pas utile d'ajouter
- Code: Tout sélectionner
Disallow: /php/xrvftsvryf/
- Code: Tout sélectionner
Disallow: /php/xrvftsvryf/pxvrfzvrt/
Jean-Luc
Bonjour Jean-Luc
Merci beaucoup de ta réponse.
C'est bien ce que je pensais, mais ça n'explique pas pourquoi mon site en ligne ( sous ce ndd ) depuis Septembre 2008, n'est toujours pas archivé. ;(
Merci beaucoup pour l'info sur le sous-répertoire, je vais le supprimer tout de suite.
Bien à toi.
Amicalement.
Jean-François Ortolo
-

ortolojf - WRInaute passionné

- Messages: 1674
- Inscription: 14 Aoû 2002
Re: Mon fichier robots.txt laisse-t-il passer ia_archiver ?
HawkEye a écrit:(et soit dit en passant, il ne faut pas interpréter ce que dit Matt Cutts au premier degré)
Bonjour HawkEye
Merci beaucoup pour ton annuaire.
Tu fais allusion au fait que Matt Cutts déconseille l'utilisation du fichier robots.txt pour interdire l'accès à des urls pour des moteurs ?
J'ai lu hier soir la traduction de l'interview de Joachim ( je crois que c'est le bon prénom, j'ai oublié le nom ) du service des indexations de Google, disant celà aussi, mais je ne savais pas que Matt Cutts disait la même chose.
Je sais aussi, que dans cette interview la commentatrice donnait un bémol par rapport à celà.
En tout cas, je vais enlever le sous-répertoire indiqué par Jean-Luc.
Merci beaucoup de ta réponse.
Bien à vous.
Amicalement.
Jean-François Ortolo
-

HawkEye - WRInaute accro

- Messages: 17013
- Inscription: 23 Fév 2004
Re: Mon fichier robots.txt laisse-t-il passer ia_archiver ?
Bonjour Jean-François,
Je pensais que ta démarche était la conséquence de ceci: http://www.webrankinfo.com/actualites/200911-matt-cutts-spam.htm
Je pensais que ta démarche était la conséquence de ceci: http://www.webrankinfo.com/actualites/200911-matt-cutts-spam.htm
-

ortolojf - WRInaute passionné

- Messages: 1674
- Inscription: 14 Aoû 2002
Re: Mon fichier robots.txt laisse-t-il passer ia_archiver ?
HawkEye a écrit:Bonjour Jean-François,
Je pensais que ta démarche était la conséquence de ceci: http://www.webrankinfo.com/actualites/200911-matt-cutts-spam.htm
Bonjour HawkEye
Effectivement, c'est après avoir lu cet article de Wri, que j'ai voulu vérifier si mon fichier robots.txt ne filtrait pas ia_archiver
Ce fut un déclic, mais je pensais depuis longtemps que je ne filtrais aucun moteur, à part pour les sous-répertoires dans le fichier robots.txt , mais j'étais surtout étonné de ne pas être archivé, surtout après avoir reçu le 9 Novembre 2009, la visite de ia_archiver ( Alexa ), qui m'a aspiré ce fichier.
En fait, peut-être entre-temps, j'ai cliqué sur un lien demandant à archive.org de me visiter. Mais je ne me rappelle plus si ç'était avant ou après le 9 Novembre... Probablement après.
J'ai donc fait une grosse boulette en cliquant sur ce lien, ce qui a remis à zéro les conclusions de archive.org : Il sera obligé de revoir ce fichier robots.txt, dans quelques semaines, avant de parcourir mon site.
Et puis... En fait j'ai des indications contradictoires sur le fait de savoir si ce site archive.org , est encore actif ou non.
D'un côté, sur leur site il y a des indications sur des upgrade de leur système hardware et autres procédures, avec des liens corrects, de l'autre côté sur Wri, j'ai vu des commentaires comme quoi archive.org n'était plus actif.
Mon site sous ce ndd, est valide depuis Septembre 2008, il n'a jamais été archivé par le site.
Il est vrai, que mon site est encore accessible par son ancien ndd, qui lui est archivé, je vais d'ailleurs voir jusqu'à quand...
Je croyais que archive.org comprenait les redirections 301 comme le fait Google, mais c'est fort possible que ce ne soit pas le cas.
Merci beaucoup de ta réponse.
Bien à toi.
Amicalement.
Jean-François Ortolo
7 messages
• Page 1 sur 1
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Gmail laisse passer un virus !
- [AdSense] Google laisse passer des AdSenses scie*ntol*ogues?
- Gros bug de Google : l'algorithme Panda laisse passer certaines techniques désuètes
- mon code fichier robots.txt
- Mon fichier robots.txt est ok?
- Que mettre dans mon fichier robots.txt?
- robots.txt Le fichier bloque l'accès à mon site
- Google ne reconnait pas mon fichier robots.txt
- Google passe outre mon fichier robots.txt , pages ré-indexées
- probleme avec fichier robots.txt fichier bloquer
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités
