Quelques outils de fabrication d’un epub

Structure d’un fichier epub

Ce blog s’adressant à des auto-éditeurs, nous ne rappellerons pas ici les bases de l’édition et supposons acquises les notions de style et de typographie.

Il existe bien des façons de préparer un ebook ; cependant, la méthodologie suit toujours le même principe. Il s’agit de transformer un texte numérisé, qui se lisait dans un éditeur de texte, en un texte au format epub, pour une lecture sur liseuse, tablette, smartphone ou autre support.

Nous effectuerons des tests avec un texte court, comportant quelques styles de paragraphe (Titre, Standard et Note) que nous convertirons au format epub avec différents outils. Notre ebook comportera également une image avec habillage, ainsi qu’un lien vers une note de bas de page.

Styles

Styles utilisés

Qu’est-ce qu’un fichier epub, en somme ? Ce n’est pas autre chose qu’un dossier zippé comprenant une arborescence de fichiers, texte, feuilles de style et images notamment. Toute la conversion consiste donc à transformer notre texte édité en code HTML qui sera « compris » par le support de lecture.

odtzip

Fichier odt décompressé et son contenu HTML

Un bon outil de conversion est celui qui respectera les styles appliqués et restituera un code HTML propre.

Les outils gratuits

Méthode manuelle

Nous allons réaliser notre premier epub avec les logiciels libres Open Office dans sa version 4.0.1 et Sigil. Notre texte se présentera donc sous la forme d’un fichier avec une extension odt. Sauvegardons-le au format HTML puis ouvrons le fichier dans un éditeur de texte gratuit (Notepad++ par exemple) et analysons le code généré.

On y observe tout d’abord un certain nombre de balises de type META :

<META NAME="GENERATOR » CONTENT="OpenOffice 4.0.1 (Win32)">
<META NAME="AUTHOR » CONTENT="eForge">
<META NAME="CREATED » CONTENT="20131111;16190000">
<META NAME="CHANGEDBY" CONTENT="eForge « >
<META NAME="AppVersion » CONTENT="14.0000">
<META NAME="Company » CONTENT="Microsoft">
Balises META

Puis vient notre texte, mais privé des styles de paragraphe que nous lui avions appliqués dans l’éditeur. Nos styles (Titre, Standard, Note) ont disparu et ont été remplacés par des balises header (<H1>) ou paragraphes (<P>) dotés d’attributs de type align, margin, font-size.

ODTHTML

Export du fichier dans Open Office, au format HTML

<H1 ALIGN=CENTER>DELHI</H1 → Ici, on aurait dû retrouver le style Titre

<P STYLE=margin-bottom: 0.35cm>Le nom de Dehli</P → Là, on aurait dû retrouver le style Standard

<P STYLE=margin-bottom: 0.35cm><FONT SIZE=2><A NAME= »sdfootnote1sym » HREF= »#sdfootnote1anc »>1</A></P → Là, on aurait dû retrouver le style Note

Si le document ne comporte qu’un nombre restreint de styles, quelques rechercher/remplacer dans Sigil en utilisant le mode Regex auront tôt fait de nettoyer tout cela. Ainsi, dans cet exemple, nous observons que l’attribut font-size=2 suffit pour distinguer le style Standard du style Note ; il suffirait donc de rétablir d’abord le style Note, puis le style Standard, puis le style Titre (les headers h1), ce qui serait rapide et simple.

Une astuce permet de retrouver le code sans avoir à passer par ce stade de conversion : un fichier « .odt » ayant la même structure qu’une archive compressée, on peut en effet en extraire, en le dézippant, le code de notre texte, avec nos styles, qui se trouve dans le fichier content.xml.

En éditant le fichier, on voit que les styles de paragraphes ou de caractère sont encadrés par des balises du type <text:p text:style-name= »nom du style« >. Là encore, un bon usage de Regex sous Sigil ou dans un éditeur de texte avancé permettra en quelques clics de remplacer ces balises par un code HTML propre.

À présent, nous disposons de notre texte stylé muni de balises HTML (paragraphes avec leur classe de style, enrichissements italiques, gras…) qu’il convient de charger dans Sigil. Si on dispose de Firefox, il existe un plugin, Grabmybook qui va générer directement un fichier epub depuis l’onglet ouvert dans le navigateur. Nous associons à ce fichier HTML une feuille de styles que nous avons préalablement définie et le tour est joué !

Méthode automatisée

Des extensions destinées à la conversion automatique au format epub ont été développées pour Open Office. Sous sa dernière version 4.0, nous n’avons pas été en mesure de les faire fonctionner. Cependant, les tests que nous avions effectués sur des versions antérieures avaient donné des résultats médiocres. Un logiciel gratuit, développé par Alkinea, convertit les fichiers odt au format epub et même mobi, si kindlegen est présent sur la machine.

Akinea

Export du fichier avec Alkinea

Une validation par epubcheck montre l’erreur suivante, qui traduit un problème de déclaration de la table de navigation dans la « check-list » de l’epub, le fichier content.opf :

ERROR: E:/eForge/Sandbox/OUTILS/Test.epub/OEBPS/content.opf(19,20): item with id ‘ncx’ not found
WARNING: E:/eForge/Sandbox/OUTILS/Test.epub: item (OEBPS/toc.ncx) exists in the zip file, but is not declared in the OPF file

Vu qu’il n’y a pas de table des matières, à ce stade, ceci n’est pas bien grave.

Mais l’ouverture du fichier avec Sigil va révéler d’autres soucis :
– le renvoi de note n’a pas été compris et la note se trouve maintenant accolée à son renvoi dans le corps du texte ;
– les styles de paragraphes ne figurent pas dans la feuille de style générée : il faudra donc tous les réintégrer ;
– l’image de couverture a été flanquée d’un attribut height qui l’anamorphose : <img alt= »Cover » height= »100% » src= »../Images/cover.jpg »/>
– la version Kindle générée ne passe pas par le mode verbose, ce qui est inquiétant puisque l’epub source était défectueux.

Les outils payants

Méthode manuelle

Word, d’un emploi courant, permet de sauvegarder le texte au format HTML filtré. Cependant, le code généré par MSWord n’est pas très propre et exige un nettoyage, même si les styles de paragraphe sont conservés. Il suffira, comme indiqué précédemment, de quelques remplacements pour supprimer les classes de style parasites, de type MsoXXXX. En revanche, les liens sont préservés, tout comme les enrichissements.

MSword

Export HTML filtré depuis MSWord

Une autre solution pour obtenir un code HTML plus propre : s’envoyer son propre fichier « .doc » en pièce jointe sur un compte mail Google (gmail). Une fois le mail reçu, passer en mode d’affichage de la pièce jointe HTML et afficher/copier le code source de la page. Comme on le voit dans la capture ci-dessous, le code est relativement propre :

Google Html

HTML généré par Google

Méthode automatique

E-Book Tools, est une extension gratuite (en anglais/néerlandais) pour Word qui convertit le fichier doc en epub. L’outil est paramétrable, conserve les styles de paragraphes, effectue un nettoyage du code HTML puis un export au format epub avec l’ajout d’une couverture, de métadonnées et bien plus encore ¦

E-book Tools

Génération du code HTML et export de l’epub avec e-Book Tools

Le fichier epub généré est presque parfait.

Les outils professionels

La Rolls de l’édition, Indesign CS6, permet d’exporter automatiquement les contenus au format epub (ou mobi si l’on installe le plugin Kindlegen). Les nouveaux aménagements d’Indesign CS6 dans sa version Creative Cloud ont eu une incidence considérable sur la génération de fichiers epubs. Parmi les nouveautés, l’export d’un index (linké s’il vous plaît), la prise en charge des objets (ce qui permet d’ancrer une image), l’ajout d’un fichier pour la prise en compte des polices (pour Apple), des fontes embarquées qui fonctionnent, la liste est ici… Mais tout cela a un prix.

Indd

Export epub avec Indesign CS6

3 réponses à “Quelques outils de fabrication d’un epub

  1. to

    « La Rolls de l’édition, Indesign CS6, permet d’exporter automatiquement les contenus au format epub »

    Nooon par pitié, surtout pas ! Cette approche est tout sauf professionnelle ! Il faut arrêter avec cette ignoble tradition de numérisation « texte > PAO > texte ».

    À chaque utilisation de cette fonction d’InDesign, l’édition numérique fais un pas de plus vers le Moyen Âge !

    Répondre
    1. eforge Auteur de l’article

      Effectivement, c’est un peu presse-bouton, Indd, pour faire de l’epub. Et cela n’empêche pas – au contraire – les nettoyages du code HTML généré et des CSS. Quant aux images ….
      Ce n’est pas une bonne option pour les néophytes, c’est entendu, mais cela peut rendre service lorsqu’on travaille sur un document qui sera publié dans d’autres formats.

      Répondre
  2. Ping : Créer un eBook au format ePub | Bibliothèque numérique et ebooks

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

*

1 × un =