dictionnaire domaine public
12 messages • Page 1 sur 1
Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics
-

ecocentric - WRInaute accro

- Messages: 3577
- Inscription: Mar Fév 10, 2004 16:40
dictionnaire domaine public
Il y a pas mal de dictionnaires passés dans le domaines publique (ce qui m'intéresse : définitions et synonymes). Je me demandais si, dans le cadre de projets comme Gutenberg, si certains de ces dictionnaires avaient été numérisés et pouvaient être téléchargés ?
Dernière édition par ecocentric le Mar Avr 19, 2005 13:46, édité 1 fois.
-

ecocentric - WRInaute accro

- Messages: 3577
- Inscription: Mar Fév 10, 2004 16:40
serval2a a écrit:Tu as gallica qui offre certains textes, sur bnf.fr
mais apparemment pas de dictionnaire. Ceci dit, ce site est bien intéressant.
Hum hum... http://gallica.bnf.fr/Sujets/SujetsD.htm : 9 rubriques commencent par le mot "dictionnaire" ou "Dictionnaires".ecocentric a écrit:serval2a a écrit:Tu as gallica qui offre certains textes, sur bnf.fr
mais apparemment pas de dictionnaire. Ceci dit, ce site est bien intéressant.
On y trouve en particulier le très utile Larousse du XIXe siècle: http://gallica.bnf.fr/Catalogue/notices ... 995829.htm
Pour les synonymes: http://gallica.bnf.fr/Catalogue/notices ... 252060.htm
-

ecocentric - WRInaute accro

- Messages: 3577
- Inscription: Mar Fév 10, 2004 16:40
En effet, bien vu, par contre, apparemment, ce sont des PDF.
http://gallica.bnf.fr/faq.htm dit:
Sur Gallica, la plupart des documents sont en PDF (sauf ceux listés dans http://gallica.bnf.fr/textes.htm qui sont en mode texte). http://gallica.bnf.fr/dicos/dictionnaires.htm te donne aussi un accès commode.
Je ne crois pas qu'on puisse l'exporter, c'est du PDF en mode image. Il faudrait passer un OCR dessus.
Pourquoi ne pas tout numériser en mode texte ?
Le mode image conserve l’aspect initial de l’original y compris ses éléments non textuels.
Si le mode texte, autorise des recherches riches et précises dans un document et permet une réduction significatice du volume des fichiers manipulés, sa réalisation, soit par saisie soit par OCR, implique des coûts de traitement environ 10 fois supérieurs à la simple numérisation.
Ces techniques parfaitement envisageables pour des volumes limités ne pouvaient ici être économiquement justifiables au vu des 50000 documents (représentant presque 15 millions de pages) mis en ligne.
Sur Gallica, la plupart des documents sont en PDF (sauf ceux listés dans http://gallica.bnf.fr/textes.htm qui sont en mode texte). http://gallica.bnf.fr/dicos/dictionnaires.htm te donne aussi un accès commode.
Je ne crois pas qu'on puisse l'exporter, c'est du PDF en mode image. Il faudrait passer un OCR dessus.
-

French Dread - WRInaute accro

- Messages: 1973
- Inscription: Mer Mai 07, 2003 10:04
http://fr.wiktionary.org mais il début donc pas forcement le plus exhaustif
-

ecocentric - WRInaute accro

- Messages: 3577
- Inscription: Mar Fév 10, 2004 16:40
French Dread a écrit:http://fr.wiktionary.org mais il début donc pas forcement le plus exhaustif
Je l'ai a l'oeuil, celui-là
Ils n'ont encore de base de données séparée, mais ils travaillent dessus (je pense avoir vu qu'ils ont eu un financement pour le faire).
Le dictionnaire de l'Académie française:
8e éd. (1932-1935): http://www.atilf.fr/academie8
9e éd. (1994-....), lettres A à N (jusqu'à "Négaton") parues: http://www.atilf.fr/academie9
Lui est en mode texte, mais je ne pense pas qu'il soit libre de droits...
Lui est en mode texte, mais je ne pense pas qu'il soit libre de droits...
Si la 8e édition est presque entièrement dans le domaine public:
Je cite :
La 8e édition du dictionnaire de l'Académie française contient 2 tomes. Le premier tome (A-G, 622p) a été publié en 1932, et le deuxième tome (H-Z, 743p) a été publié en 1935.
Donc, le premier volume (A-G) est dans le domaine public depuis le 1er janvier 2003, et le deuxième volume (H-Z) sera dans le domaine public le 1er janvier 2006.
Boris
Je cite :
La 8e édition du dictionnaire de l'Académie française contient 2 tomes. Le premier tome (A-G, 622p) a été publié en 1932, et le deuxième tome (H-Z, 743p) a été publié en 1935.
Donc, le premier volume (A-G) est dans le domaine public depuis le 1er janvier 2003, et le deuxième volume (H-Z) sera dans le domaine public le 1er janvier 2006.
Boris
tuisp a écrit:http://gallica.bnf.fr/faq.htm dit:Pourquoi ne pas tout numériser en mode texte ?
Le mode image conserve l’aspect initial de l’original y compris ses éléments non textuels.
Si le mode texte, autorise des recherches riches et précises dans un document et permet une réduction significatice du volume des fichiers manipulés, sa réalisation, soit par saisie soit par OCR, implique des coûts de traitement environ 10 fois supérieurs à la simple numérisation.
Ces techniques parfaitement envisageables pour des volumes limités ne pouvaient ici être économiquement justifiables au vu des 50000 documents (représentant presque 15 millions de pages) mis en ligne.
Sur Gallica, la plupart des documents sont en PDF (sauf ceux listés dans http://gallica.bnf.fr/textes.htm qui sont en mode texte). http://gallica.bnf.fr/dicos/dictionnaires.htm te donne aussi un accès commode.
Je ne crois pas qu'on puisse l'exporter, c'est du PDF en mode image. Il faudrait passer un OCR dessus.
Bonsoir,
C'est quoi OCR ? Une sorte de reconnaissance de caractères, c'est ça ? Sinon Google, archive.org semblent avoir réussi dans ce domaine, à moins que je me trompe...
12 messages • Page 1 sur 1
Formation recommandée sur ce thème :
Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Lancement d'un dictionnaire collaboratif en ligne
- Dictionnaire + annuaire = annuaire du Dico du Net
- Rachat de Fast Search par Microsoft
- Google AdSense Calendar
- Sortie de GoogleStats v2.01
- Comment éviter de se faire voler son nom de domaine...
- WebRankInfo lance un forum sur les noms de domaine
- Noms de domaine : Google se lance dans le marché
- Du nouveau du côté des laboratoires de Google : Google Labs
- Google Labs, les labos de Google se montrent au public
- domaine .eu ouverture au public
- Délai de retombé dans le domaine public d'un .fr
- Heure ou un ndd en .com retombe dans le domaine public ?
- Droits d'auteur, Publication d'oeuvres du domaine public
- Concernant le domaine public, Google et autres bibliothèques numériques...
- racheter un nom de domaine qui va retomber dans le public
- NDD parkés,exiprés,domaine public...indexation, blacklist > kezako??
- Le dictionnaire WebRankInfo
- [Google] Dictionnaire
- Référencement dictionnaire
- Site de dictionnaire
- outils dictionnaire
- Dictionnaire des cooccurrences
- script php dictionnaire
- Un dictionnaire chez Google ?
Consultez la description détaillée des produits ou services de Google suivants : Google Apps for your Domain, Google Apps Edition Premium, Google Book Search
- Trouver les sous-domaines
Cet outil vous permet de trouver la liste des sous-domaines (indexés) d'un site.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités



le forum