Transcription de PDF en texte
9 messages
• Page 1 sur 1
-

nickargall - WRInaute accro

- Messages: 6469
- Inscription: 13 Juin 2005
Transcription de PDF en texte
Bonjour a tous
Je suis à la recherche d'informations sur d'éventuels scripts PHP existant, permettant de lire un PDF et d'en extraire le texte, pour ensuite l'ajouter dans une BDD en mode "plain text" (pas de HTML).
Je ne cherche pas de solution OCR, mais des classes ou scripts PHP qui permettent d'extraire du texte de documents générés par par Xpress, "à la volée", donc à priori avec du contenu texte correctement encapsulé.
... sans avoir besoin d'acquérir une licence, ou de compiler du C++ pour un serveur Linux...
L'idée c'est qu'un utilisateur puisse mettre un fichier PDF en ligne et que le script PHP en extraie le contenu pour en faire une version alternative dans une base de données, pour utilisation ultérieure dans un moteur de recherche.
Et non, je ne veux pas utiliser les solutions Google
Je n'ai rien trouvé qui puisse correspondre à ce que je recherche, je jette donc une bouteille à la mer ici ..
Si quelqu'un a déjà vu quelquechose comme celà
Je suis à la recherche d'informations sur d'éventuels scripts PHP existant, permettant de lire un PDF et d'en extraire le texte, pour ensuite l'ajouter dans une BDD en mode "plain text" (pas de HTML).
Je ne cherche pas de solution OCR, mais des classes ou scripts PHP qui permettent d'extraire du texte de documents générés par par Xpress, "à la volée", donc à priori avec du contenu texte correctement encapsulé.
... sans avoir besoin d'acquérir une licence, ou de compiler du C++ pour un serveur Linux...
L'idée c'est qu'un utilisateur puisse mettre un fichier PDF en ligne et que le script PHP en extraie le contenu pour en faire une version alternative dans une base de données, pour utilisation ultérieure dans un moteur de recherche.
Et non, je ne veux pas utiliser les solutions Google
Je n'ai rien trouvé qui puisse correspondre à ce que je recherche, je jette donc une bouteille à la mer ici ..
Si quelqu'un a déjà vu quelquechose comme celà
-

skyll - WRInaute passionné

- Messages: 1364
- Inscription: 14 Oct 2005
Re: Transcription de PDF en texte
nickargall a écrit:Je n'ai rien trouvé qui puisse correspondre à ce que je recherche, je jette donc une bouteille à la mer ici ..
Si quelqu'un a déjà vu quelquechose comme celà
Tiens, je cherche aussi quelque chose comme ca, mais j'ai rien trouvé...
-

nickargall - WRInaute accro

- Messages: 6469
- Inscription: 13 Juin 2005
Re: Transcription de PDF en texte
Ca, ça peut se faire, ca serait sur un dédié. Et ensuite ? 
- jamalofski
- WRInaute discret

- Messages: 219
- Inscription: 3 Mar 2007
Re: Transcription de PDF en texte
Je vais faire un peu de pub pour mon site puisque personne ne propose autre chose
Conv2pdf proposera ce service avec son API dans très peu de temps (Quelques jours maximum)
Conv2pdf proposera ce service avec son API dans très peu de temps (Quelques jours maximum)
-

nickargall - WRInaute accro

- Messages: 6469
- Inscription: 13 Juin 2005
Re: Transcription de PDF en texte
Ok, mais en l'occurence je ne cherche pas de passage par une solution tierce, mais un module, un script, une classe PHP autonome à installer sur un serveur & un site PHP
-

carole heinz - WRInaute accro

- Messages: 2855
- Inscription: 28 Fév 2007
Re: Transcription de PDF en texte
-

nickargall - WRInaute accro

- Messages: 6469
- Inscription: 13 Juin 2005
Re: Transcription de PDF en texte
Merci carole, je vais creuser sur PDFbox
c'uila , je l'avais pas vu 
9 messages
• Page 1 sur 1
Lectures recommandées sur ce thème :
Consultez la description détaillée des produits ou services de Google suivants : Google PDF Quick View
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités

