La BNF archive...

Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics


Digit
WRInaute passionné
WRInaute passionné
 
Messages: 613
Inscription: Ven Avr 18, 2003 0:19

La BNF archive...

Message le Dim Jan 23, 2005 11:30

Bonjour,

J'ai constaté que la BNF (Bibliothèque Nationale de France) a effectué un partenariat avec archive.org et a débuté un archivage des sites français.
Extrait des logs afin d'identifier l'empreinte :
Code: Tout sélectionner
207.241.234.209 - - [22/Jan/2005:16:16:57 +0100] "GET / HTTP/1.0" 200 32945 "-" "mozilla/5.0 (compatible; heritrix//1.3.0-200412151053 +http://crawls.archive.org/collections/bnf/crawl.html)" mod_gzip: DECLINED:NO_ACCEPT_ENCODING In:0 Out:0:0pct.


A noter :
    Le crawl est lent
    il respecte le robots.txt
    dès qu'une page est accédée, ses éléments graphiques sont récupérés


Pour en savoir plus :
http://bibnum.bnf.fr/robot/


soccarfr
WRInaute discret
WRInaute discret
 
Messages: 99
Inscription: Mer Sep 01, 2004 10:28

Message le Dim Jan 23, 2005 17:15

ce robot est completement idiot, il a suivit les liens de mes formulaires, faisant par la même des grosse betises sur mon site

Haq
WRInaute accro
WRInaute accro
 
Messages: 2104
Inscription: Jeu Aoû 29, 2002 21:18

Message le Dim Jan 23, 2005 17:18

soccarfr a écrit:ce robot est completement idiot, il a suivit les liens de mes formulaires, faisant par la même des grosse betises sur mon site


Si c'est possible, c'est à toi que tu dois t'en prendre... tu dois faire en sorte qu'un robot ne puisse pas influer sur le contenu de tes sites (sinon, je ne te parle même pas de ce que pourrait faire le robot d'adsense sur ton site... lui il a accès à absolument toutes les urls que tes visteurs voient/créent pour peu que tu y affiches leur pub).

cadix
Nouveau WRInaute
 
Messages: 19
Inscription: Lun Mar 14, 2005 12:04

Message le Mar Mar 15, 2005 8:52

Est ce que les résultats sont visibles quelque part que le site de la BNF ?

tuisp
WRInaute accro
WRInaute accro
 
Messages: 2076
Inscription: Ven Juin 27, 2003 18:33

Message le Dim Mar 20, 2005 13:59

Cet archivage s'effectue dans le cadre de la nouvelle loi sur le dépôt légal en préparation comme l'indique le lien donné par Digit. Les pages collectées ne seront a priori pas consultables ailleurs que dans les locaux de la BnF, voir http://www.bnf.fr/pages/infopro/depotle ... ommuniquer

cadix
Nouveau WRInaute
 
Messages: 19
Inscription: Lun Mar 14, 2005 12:04

Message le Mer Mar 30, 2005 13:21

C'est un peu dommage.
Mais j'imagine que c'est à cause de problèmes de copyright

tuisp
WRInaute accro
WRInaute accro
 
Messages: 2076
Inscription: Ven Juin 27, 2003 18:33

Message le Mer Mar 30, 2005 15:12

C'est cela. Le fait que l'état des sites à certains moments de leur histoire soit *reproduit* a pour conséquence que les reproductions entrent dans le champ de la Directive européenne de 2001 et donc que la seule exception autorisée limite la possibilité de consulter ces reproductions aux locaux des organismes dépositaires du dépôt légal. C'est ce qui est expliqué dans la page Web dont j'ai donné le lien un peu plus haut.


Formation recommandée sur ce thème :

Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités