Générer un PDF à partir d'une page HTML sur un site

Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics

misterphil
Nouveau WRInaute
 
Messages: 18
Inscription: Jeu Mar 27, 2008 21:48

Générer un PDF à partir d'une page HTML sur un site

Message le Mar Déc 02, 2008 12:10

Bonjour,

Je reviens avec un vieux sujet mais qui ne trouve pas de réelles réponses, à savoir la génération d'un simple clic de code HTML en fichier PDF sur un serveur, c'est à dire que le fichier existera sur le serveur et ensuite on peut faire un lien dessus pour le lire à l'écran ou faire un système pour l'envoyer par mail.

J'ai testé HTML2PDF (après avoir mis des jours à pouvoir installer du perl à tout va pour que çà fonctionne), discutailler longuement avec son auteur sur son forum, mais force est de constater que beaucoup de choses ne fonctionnent pas correctement (ça viendra, j'en suis certain, mais en attendant...).

HTMLDOC, pas réussi à installer ce machin, mais bon pas dit qu'il aurait collé...

Aussi aurais-je souhaité savoir quelles solutions payantes existaient pour faire ce genre de chose. Ca doit pouvoir fonctionner sur un serveur virtuel, environnement LAMP.

J'avoue être assez sidéré de ne trouver aucune solution qui donne un résultat professionnel (comme si on convertissait depuis Acrobat sur son ordi) et adaptable facilement à un site, alors qu'on voit ça, il me semble, sur plein de sites comme ceux faits avec des CMS comme Joomla de mémoire.

Merci pour les retours d'expérience en la matière.

A+


blman
WRInaute accro
WRInaute accro
 
Messages: 2915
Inscription: Ven Sep 05, 2003 10:46

Message le Mar Déc 02, 2008 12:24

A mon avis, il serait plus simple de partir de données non formatées stockées sous format XML ou en BDD pour générer une mise en page en HTML ou PDF plutôt que de vouloir formater en PDF quelquechose déjà formaté en HTML...

misterphil
Nouveau WRInaute
 
Messages: 18
Inscription: Jeu Mar 27, 2008 21:48

Message le Mar Déc 02, 2008 12:37

Les données ne sont pas en soi dans une page HTML, elles sont saisies via TinyMCE par des auteurs qui ne connaissent rien en XML/HTML etc, et ensuite sauvegardées en BDD...
Ainsi, HTML2PDF récupère le code HTML pour générer le PDF sur le serveur à la volée et l'afficher à l'auteur pour voir quelle gueule ça a.

Evidemment si les moyens étaient là, comme j'ai pu le vivre dans beaucoup de projets précédents, on allait soit vers des documents XML (et on n'avait pas besoin de convertir en PDF au final) soit vers des données saisies dans des champs bien distincts, mais dans les deux cas, c'était des intégrateurs Web, pas des auteurs qui savent tout juste bien utiliser Word ;) Or là, le budget est à zéro et le seul investissement de départ c'est le serveur et peut-être une solution payante pour le PDF si elle existe, si elle est pas trop chère et suffisamment adaptée aux desideratas...

Voilà la situation ;)


UsagiYojimbo
WRInaute accro
WRInaute accro
 
Messages: 5229
Inscription: Mer Nov 23, 2005 10:38

Message le Mar Déc 02, 2008 12:50

Je m'étais renseigné la-dessus il y a quelques temps, et HTML2PDF était ce que j'avais trouvé de mieux, le truc c'est qu'il est vrai que beaucoup de choses (CSS et certaines balises) ne fonctionnement pas avec cet outil. Je m'en étais sorti en développant une sorte de moulinette php qui, à partir des pages HTML que je devais transformer, supprimait (ou remplaçait par des équivalents gérés par le script) tous les éléments non supportés, et au final cela marchait pas trop mal.

Sinon la solution de blman est la plus réaliste, partir des données brutes et proposer une version PDF avec une mise en page différente (simplifiée en fait).

Ou sinon installer des solutions de générations d'image depuis des pages web, et générer donc un PDF à partir de cette image, mais là c'est limite encore plus lourd...

misterphil
Nouveau WRInaute
 
Messages: 18
Inscription: Jeu Mar 27, 2008 21:48

Message le Mar Déc 02, 2008 12:58

Oui j'ai déjà un peu jouer là-dessus côté moulinette pour certaines choses, mais parfois ce n'est pas forcément possible et au niveau de TinyMCE, pas mal bidouillé depuis le temps, c'est un peu pareil, il force trop de choses, du coup ça ne simplifie pas vraiment.

Pour l'image en PDF, hmm oui ce serait des fichiers hyper lourds, surtout que ce sont des articles qui peuvent faire plusieurs pages, donc pas trop la solution non plus ;)

Je ne sais pas si Adobe propose une équivalence d'Acrobat pour un serveur... il me semblait avoir vu un truc à une époque, mais me souviens plus.


UsagiYojimbo
WRInaute accro
WRInaute accro
 
Messages: 5229
Inscription: Mer Nov 23, 2005 10:38

Message le Mar Déc 02, 2008 13:12


misterphil
Nouveau WRInaute
 
Messages: 18
Inscription: Jeu Mar 27, 2008 21:48

Message le Mar Déc 02, 2008 13:25

Alors peut-être que cette solution peut faire l'affaire, je vais lire tout ça, mais le nom ne me dit rien en soi au premier abord...

misterphil
Nouveau WRInaute
 
Messages: 18
Inscription: Jeu Mar 27, 2008 21:48

Message le Mar Déc 02, 2008 16:08

Ou peut-être pas, vu ce que je lis :

Application server

* WebSphere 6.1.0.7
* WebLogic 9.2 and WebLogic 10 MP1
* JBoss (only) 4.0.3 SP1 and 4.2.0

Operating systems

* Windows Server 2003 SP 2 and R2 SP2, Standard and Enterprise Editions
* Solaris 10/SPARC
* RedHat AS and ES 4.0 , Red Hat EL Server and AP 5.0
* SuSE ES 9
* AIX 5.3

Databases

* Microsoft SQL Server 2005 SP2
* MySQL 5.0.18 or higher
* Oracle 9i and 10g
* IBM DB2 8.2 and 9.1


Formation recommandée sur ce thème :

Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 1 invité