· Tech watch

Produire et diffuser des livres numériques

Après la musique, puis les films, voici le tour des livres. La numérisation des livres a commencé et les liseuses fleurissent dans les rayons des grandes surfaces culturelles. Les formats de livres et les modes de diffusions sont encore en construction mais des tendances se dessinent. Ce marché en pleine éclosion attise les curiosités, voici donc l’état de l’art du sujet à ce jour.

Formats

Fondamentalement, n’importe quel format de texte numérique peut être utilisé pour produire des livres numériques. Cela va du texte brut (TXT) en passant par le texte riche (RTF, HTML) jusqu’aux formats traditionnels des suites bureautiques (ODT, DOC) sans oublier le PDF (j’y reviens ci-après)

Ceci dit, les liseuses de livres numériques proposent de plus en plus de fonctionnalités spécifiques et certains formats spécialisés sont alors plus adaptés à ces matériels particuliers.

Jusqu’à une date encore récente, le marché était très fractionné avec quasiment un format propre à chaque liseuse (plusieurs dizaines à ce jour). Les choses évoluent actuellement et les différents efforts de normalisation des acteurs du marché portent leurs fruits avec quelques formats qui sortent désormais du lot.

Le format PDF

C’est le doyen des formats de livre numérique. Il a été créé par Adobe en 1993 pour faciliter l’échange de documents entre plateformes. A l’époque, sa principale caractéristique était d’embarquer l’ensemble des médias du document : les images et surtout les polices typographiques utilisées pour rendre le document. Il est une évolution du format Postscript.

La principale caractéristique du format PDF est de définir le format physique de rendu du document. C’est donc un format idéal pour l’impression ou pour la réalisation d’ouvrages très visuels comme des catalogues. En contre-partie, cela pose des problèmes pour les documents textes qui ne seront pas re-formatés selon les capacités du terminal de lecture (i. e. lire un document au format A4 sur un téléphone portable sera très problématique).

Il s’agit du format le plus portable dans la mesure où toutes les liseuses du marché sont capables de le comprendre.

Gestion des DRM[Acronyme de l’anglais “Digital Right Management” : Gestion des droits numériques. Il s’agit de méthodes et de technologies permettant à un ayant droit de définir et faire respecter les conditions d’utilisation, de reproduction et de diffusion de son oeuvre.]]

Ce format autorise l’usage de DRM pour limiter la copie, l’impression ou l’édition. Néanmoins, le respect de ces DRM dépend des liseuses. En effet, si un logiciel de lecture n’honore pas les DRM embarqués dans le document, ce document reste tout de même lisible, leur portée est donc limitée.

C’est un format ouvert qui fait l’objet d’une [normalisation par l’ISO.

Pour en savoir plus sur le format PDF, vous pouvez consulter la page Wikipédia au sujet de ce format.

Le format ePub

Le format ePub est actuellement le format émergeant pour les livres numériques. Il se base et englobe le format Open eBook. C’est un format jeune, qui a été créé en 2007. Sa principale caractéristique est de permettre le re-formatage du texte en fonction des caractéristiques physiques de la liseuse utilisée. Pour cela, il est construit sur la base de technologies Web : XML et CSS.

C’est le format idéal pour tous les documents essentiellement textuels. Par contre, il n’est pas adapté à des documents fortement visuels – comme par exemple les catalogues comportant beaucoup de photos – où il est indispensable de maîtriser le format de rendu.

Gestion des DRM

La gestion des DRM est une option possible du format ePub. Aucun format spécifique n’est imposé dans la norme ePub, ce qui permet aux éditeurs de choisir le système qu’ils veulent. En contrepartie, il n’y a pas de garantie que le système choisi sera reconnu par les liseuses, ce qui peut avoir des conséquences indésirables (ie. un document peut ne pas être lisible par une liseuse, bien qu’elle soit capable de comprendre le format ePub).

C’est un format ouvert qui fait l’objet d’une normalisation par l’IDPF.

Pour en savoir plus sur le format ePub : http://en.wikipedia.org/wiki/EPUB

Les formats MobiPocket et AZW

Le dernier format le plus répandu est le format MobiPocket. Il est lui aussi issu du format Open eBook et a les mêmes avantages et inconvénients que le format ePub. Il propose également des fonctionnalités supplémentaires en autorisant l’usage de Javascript et en offrant la possibilité d’embarquer des bases de données de type SQLite.

Le format AZW est une variante du format MobiPocket utilisée par Amazon pour le Kindle. Il embarque des mécanismes propriétaires de gestion des DRM.

Ce sont des formats propriétaires appartenant à Amazon.

Pour en savoir plus sur le format MobiPocket : http://en.wikipedia.org/wiki/Mobipocket
Pour en savoir plus sur le format du Kindle : http://en.wikipedia.org/wiki/Kindle

Liseuses

Bien qu’il existe énormément de modèles différents, les principales liseuses sur le marché français sont les Sony Reader, Le Kindle d’Amazon et l’iPad d’Apple.

On peut également inclure tous les smartphones et les tablettes utilisant le système Android, dans la mesure où il est possible d’installer des logiciels de lecture de livres électroniques sur ces appareils.

La principale caractéristique des liseuses dédiées (par oppositions aux smartphones ou aux tablettes comme l’iPad, qui sont polyvalents) c’est qu’elles proposent un affichage en noir et blanc. Elles reposent sur une technologie d’encre électronique, ce qui leur donne une autonomie sans comparaison et un confort de lecture exceptionnel, car elles offrent le même confort que le papier (i.e. elle ne sont pas retro-éclairées)

Tableau comparatifs des formats supportés :
|{}|PDF|ePub|MobiPocket|AWZ|
|Kindle|Natif|Non|Natif|Natif|
|Sony Reader|Natif|Natif|Non|Non|
|iOS Devices (iPad/iPhone/iPod Touch)|Natif|Natif|Extension|Extension|
|Android Devices (Téléphones/Tablettes)|Natif|Extension|Extension|Extension|

Pour en savoir plus sur le support des liseuses : http://en.wikipedia.org/wiki/Comparison_of_e-book_formats#Supporting_Hardware

Outils de création

Les logiciels suivants peuvent être utilisés pour créer l’un ou l’autre de ces formats. La plupart d’entre eux supportent l’import de fichiers au format HTML, ce qui est une bonne base de départ pour les formats ePub et MobiPocket.

A noter qu’il n’existe pas de logiciel permettant de créer directement le format AWZ du Kindle. Celui-ci est créé automatiquement lors du processus de publication du livre chez Amazon (voir ci-après).

A noter également que je ne signale pas ici la foule des logiciels pouvant produire exclusivement du PDF. Ils sont beaucoup trop nombreux, vous n’avez que l’embarras du choix !

|Logiciel|Plateforme|PDF|ePub|MobiPocket|
|Adobe Indesign|Windows, Mac|Oui|Oui|Non|
|Calibre[Il s’agit d’un outil de lecture et conversion de format, mais pas d’édition de contenu.]]|Windows, Mac, Linux|Oui|Oui|Oui|
|[MobiPocket Creator
|Windows|Non|Non|Oui|
|OpenOffice/LibreOffice|Windows, Mac, Linux|Oui|Extension|Non|
|Sigil|Windows, Mac, Linux|Non|Oui|Non|

A coté de ces logiciels, il est également possible de créer ces fichiers « à la main » directement sur des serveurs Web. La totalité des langages de développement serveur disposent de bibliothèques pour générer des documents PDF.

Les format ePub et MobiPocket mettant en oeuvre uniquement des technologies Web (HTML, XML, CSS) ou des technologies facilement accessibles dans ces environnements (Compression ZIP, Base de données SQLite) il est possible de les générer relativement facilement.

Il existe également quelques bibliothèques dédiées permettant de simplifier la génération de documents au format ePub. En voici quelques-unes à titre d’exemple :

|Langage|Nom|Sources|
|PHP|ePubExport|http://sourceforge.net/projects/epubexport/|
|PHP|ePub Class|http://www.phpclasses.org/epub|
|Java|ePub-Tools|http://code.google.com/p/epub-tools/|
|Java|ePubLib|https://github.com/psiegman/epublib|
|C#|ePub Sharp|http://sourceforge.net/projects/epubsharp/|

Si vous faites le choix de générer vos formats ePub vous même, il est bon de vérifier la qualité technique de votre format de sortie en utilisant l’utilitaire ePubCheck (Java).

Publication des livres

Techniquement parlant, la publication d’un livre numérique peut se faire par la simple création d’un lien de téléchargement sur un site Internet. Néanmoins, pour des questions de visibilité, il est intéressant de publier vos livres via les plateformes de téléchargement publiques existantes.

Plateformes internationales

Les plateformes internationales les plus connues sont celles d’Amazon et d’Apple. La procédure de diffusion des œuvres sur ces plateformes se fait directement en ligne. Il faut pour cela disposer de comptes utilisateurs spécifiques et suivre le processus de publication.

Amazon Kindle Store

> https://kdp.amazon.com/self-publishing/help

Amazon ne permet pas de publier directement dans le format natif du Kindle. Il est généré automatiquement à la publication. Amazon n’accepte en entrée que les formats PDF et HTML. Par contre, il offre quelque outils en ligne pour préparer le livre final.

A noter que, pour le moment, seules les versions américaines, anglaises et allemandes des sites Amazon proposent un espace de téléchargement de livres numériques.

Apple iBook Store

> https://itunesconnect.apple.com/WebObjects/iTunesConnect.woa/wa/apply

Apple permet de publier directement les format ePub générés sous réserve qu’ils passent la validation du logiciel ePubCheck (en version 1.0.5 au minimum). Il est cependant aussi possible de publier au format PDF et d’utiliser du HTML qui pourra être converti au format ePub automatiquement. Il faut également prévoir un délai de publication pouvant aller jusqu’à 72h, car Apple s’assure de la qualité et des droits du livre avant d’autoriser sa diffusion.

Plateformes indépendantes

Les plateformes indépendantes les plus connues en France sont feedbooks.com et inlibroveritas.net

Feedbooks.com

La procédure de publication est bien expliquée sur le site de Feedbooks. Au delà des fonctions de publication et de vente de livre numérique du site lui même, la principale spécificité de FeedBooks et de fournir une API permettant de construire sa propre plate-forme sur la base de l’infrastructure de FeedBooks.

In Libro Veritas

Le mode de publication est, comme dans le cas de Feedbooks, détaillé sur le site de la plateforme. Le positionnement commercial de In Libro Veritas est assez particulier, dans la mesure où la diffusion de livre numérique est toujours gratuite chez eux. Ils sont, en particulier, promoteurs de la licence Art Libre, et ont orienté leur business model sur la vente de livres papier comme source de revenu.

Grandes surfaces culturelles en ligne

Les grandes surfaces culturelles française commencent à s’y mettre, la FNAC, Virgin et Cultura ont toutes annoncé des plans en ce sens. La FNAC et Cultura ont effectivement commencé la vente de livres numériques. La diffusion de livres via ces plateformes très institutionnalisées passe encore par les circuits d’édition traditionnels, qui ne permettent pas aux producteurs de livres numériques de diffuser leurs œuvres directement via un service en ligne.

4 commentaires

  1. Merci de ce billet. Juste un petit détail.
    Vous dites que le format epub est un « format jeune, qui a été créé en 2007 ». Mais ce produit est dans la continuité d’un premier format, nommé Open eBook Publication Structure (OEBPS), qui correspond à la structure sous-jacente du format epub. Et ce format sous-jacent que vous citez (Open eBook) date de 1999. La structure qui déploie ce format a une pratique déjà ancienne.

  2. Bonjour,
    Bravo pour cet article bien documenté.
    Un an après la parution de cet article, les choses ont encore évolué.
    Ce serait super d’avoir un point chaque année, car tout ceci va très vite.
    Question: existe-t-il un site qui se charge pour la personne qui désire être éditée en numerique, des formalités de changements de formats et d’inscription sur Apple store, fnac, avec obtention de ISBN, etc.?
    merci
    cordialement
    Chris

  3. Le problème avec les liseuses, c’est qu’on ne peut pas faire des recherches croisées (tout fonctionne avec des hyperliens).
    par exemple, avec un eBook sur la cuisine asiatique si je veux connaitre une recette avec du poulet, sans gluten et qui soit aigre-doux, je ne peux pas le faire en cliquant sur des boutons. Seules une très (trop) longue) table des matières listant toutes les combinaisons possibles permettra de le faire.
    Existe t’il des développements en cours pour rendre une liseuses compatible avec une utilisation de base de données?

    A+
    Zadigue

  4. Christophe Lucius

    Il est vrai que le numérique est l’évolution du livre mais pour beaucoup (surtout les fans du livre en papier), c’est un cri au scandale…pour ma part, je trouve que c’est la suite normale des choses..je reviens notamment sur le sujet ici: http://christophelucius.fr/post/97737452276/livres-numeriques-quel-est-le-juste-prix

Les commentaires sont désormais fermés.