FAQ fourniture de contenu

From DPWiki
Jump to: navigation, search
DP Official Documentation - Content Providing and Project Management
Le contenu de cette page est périmé et la traduction demande une mise à jour. Si vous avez des questions, veuillez contacter l'un de ses éditeurs (lien tout en bas de cette page).
Langues: English Français Português
FAQs

Cette page est une traduction/trahison abrégée de la FAQ anglaise.

Il n'est pas nécessaire d'être membre de DP pour fournir du contenu. Néanmoins vous aurez peut-être du mal à trouver un responsable de projet pour accompagner votre livre si vous n'êtes pas membre. Si vous voulez uniquement fournir des scans sans créer le texte initial, vous pouvez utiliser le pool OCR.

Choisir un projet

Vous êtes entièrement libre du choix de livre. La seule exigence est qu'il faut absolument que le livre ait une clearance. Il est préférable que le livre vous intéresse, ce qui augmente les chances que le livre intéresse d'autres personnes également.

Trouver un livre

Il y a de nombreuses façons de trouver un livre. Vous pouvez regarder en bibliothèque, acheter chez un bouquiniste ou un libraire, fouiller vos propres étagères, demander à des amis, faire les poubelles, ou trouver des livres déjà scannés dans l'une des nombreuses sources de scans. Prenez évidemment un projet sur lequel vous aurez plaisir à travailler, car il vous faudra accompagner ce projet à travers de nombreuses étapes (surtout si vous choisissez d'être le responsable de projet), ce qui prendra du temps avant que le livre soit posté.

Pour avoir de bonnes chances que le livre soit traité rapidement, choisissez un livre d'un genre populaire et tenez compte des files d'attente.

Si vous choisissez de faire usage des archives de livre en ligne, respectez les condition d'emploi de ces archives: nous voulons garder des relations de bon voisinage. Les bonnes manières veulent que nous mentionnons dans les Crédits les sources des scans, donc il faut s'assurer que le responsable de projet en a connaissance.

Difficulté

Certaines choses rendent un livre plus difficile qu'un autre. Posez-vous la question du temps que vous voulez consacrer à un livre donné. Vérifiez la marge intérieure : plus elle est large, plus le livre sera facile à scanner, à passer à l'OCR, et moins il y aura de questions par la suite sur des mots illisibles en marge. Les illustrations rendent également les projets plus difficiles à préparer. Cela ne veut pas dire qu'il est déconseillé de travailler sur des livres à marge intérieure étroite, mais simplement que ces derniers sont plus exigeants. Voyez Préparer les scans et Préparer les illustrations.

Copyright

Faites une vérification préliminaire pour vérifier que le projet est susceptible d'obtenir une clearance. Typiquement, vérifier que le livre a été publié avant 1925.

Est-ce que le projet existe déjà?

Assurez-vous que le livre n'a pas déjà été transcrit en regardant aux endroits suivants:

Dans la liste de David Price, "Copyright Cleared" signifie que quelqu'un a demandé une clearance pour le projet, mais n'a pas encore fini le projet. Si le permis est vieux de plusieurs années, il y a de bonne chances pour que le projet ait été abandonné. Dans ce cas, après que vous avez obtenu un nouveau permis pour ce livre, David Price vous enverra un email vous mettant en relation avec l'autre personne: vous pouvez alors savoir si le livre est réellement abandonné.

Certains projets, principalement des périodiques ou des éditions en de nombreux volumes, ont des permis chapeau ("blanket clearances"). Cela ne signifie pas que la personne ayant demandé la clearance a l'intention de traiter tous les volumes. Vous pouvez vous renseigner sur le forum pour voir si un des membres de DP travaille sur ces ouvrages.

Cas des livres en français

Pour éviter la duplication inutile des efforts, concernant les livres en français nous évitons en général de refaire des livres déjà numérisés par les projets parallèles de numérisation de livres français:

Depuis janvier 2013, www.noslivres.net présente un catalogue des livres électroniques en français du domaine public, publiés sur divers sites (ce catalogue ne recense donc pas les livres en cours de production sur DP, DP-Canada, etc.).

(Auparavant, jusqu'en août 2009 Sébastien Blondeel recensait les livres déjà numérisés sur DP, PG, DP-Canada, DP-Europe, ebooksgratuits et Gallica: http://quatramaran.ens.fr/~blondeel/PGDP/catalog)

Refaire un projet déjà posté sur PG

Il est envisageable, dans certains cas, de refaire un livre déjà transcrit. La façon de faire sera différente selon les cas, et donc il vaut mieux être bien sûr de savoir dans quel cas on se situe avant de se lancer. Le projet Gutenberg accepte des éditions différentes, ou des versions illustrées, ou des traductions différentes, etc. De plus, beaucoup de livres électroniques réalisés dans le passé comportent plus d'erreurs que ce qu'on accepterait de nos jours, et un passage par DP peut être la meilleure façon de corriger ces erreurs. Si un livre comporte un numéro d'ebook inférieur à 10000, il y a de fortes chances qu'il n'ait pas de version illustrée ou HTML et soit un bon candidat pour être refait.

Voici une liste de raisons possibles pour faire passer un projet existant via DP. Dans tous les cas il faudra une clearance. Pour les reprises d'œuvres déjà numérisées, le responsable du projet devrait indiquer dans les commentaires de projet pour quelle raison on travaille à nouveau sur le livre. Si vous êtes uniquement fournisseur de contenu, incluez dans l'archive zip un fichier texte détaillant pour quelle raison refaire ce livre.

Mise à jour basique
Il s'agit de la même version texte, sans illustrations, et le texte déjà sur le projet Gutenberg est plein d'erreurs: N'oubliez pas d'indiquer, au moment de poster la version finale sur PG, qu'il s'agit d'une révision d'un ebook existant, basé sur les images scannées d'un original papier. S'il n'y a que peu de problèmes, traitez-les en soumettant des errata.
Mise à jour des illustrations
Il s'agit de la même version texte, avec des illustrations absentes de la version déjà sur PG : faites comme pour la mise à jour basique, en soumettant dans ce cas une version HTML illustrée.
Traduction différente
Le projet Gutenberg considèrera cela comme un livre totalement différent, qui sera le bienvenu. Il y a par exemple au moins une demi-douzaine de traductions de l'Iliade, et d'autres traductions seront toujours acceptées pour étendre le catalogue.
Édition différente
S'il s'agit d'une édition différente du même livre, elle sera acceptée comme un livre différent, à condition de documenter le fait que cette édition comporte des différences significatives par rapport à l'édition déjà sur PG.

Obtenir une clearance

Vous avez choisi un livre, il vous semble à la fois susceptible de recevoir une clearance et non encore transcrit ou en cours de transcription. C'est le moment de demander aux experts du copyright.

Il vous faudra les images scannées de la page de titre et son verso, et plus généralement copie de toutes les pages permettant d'établir la date du livre.

La clearance

La clearance matérialise la reconnaissance par les experts du copyright du Projet Gutenberg que le livre est libre de droits aux États-Unis. Le Projet Gutenberg utilise un certain nombre de Règles pour déterminer si un livre est éligible. Ce site DP fonctionne sous la loi des États-Unis d'Amérique, et ne peut pas traiter un livre n'ayant pas reçu au préalable une clearance.

Les détails des règles sont exposés sur le Copyright_How-To.

Si le livre ne peut pas recevoir de clearance, mais que l'auteur et toutes les autres personnes intervenant (illustrateur, éditeur, traducteur, ...) sont décédées depuis au moins 50 ans, vous pouvez essayer de faire traiter le livre sur DP-Canada hébergé dans un pays où les œuvres deviennent libres de droits 50 ans après le décès de leurs auteurs.


Doublons

L'équipe en charge des clearances ne vérifie pas l'existence de clearances en double ou pré-existants.

David Price vérifie, un certain temps après que la clearance a été donnée, s'il y a plusieurs personnes ayant une clearance pour le même livre, et si c'est le cas, envoie un email aux personnes concernées pour qu'elles se coordonnent le cas échéant. Mais il vaut mieux vérifier par soi-même avant. De même, ce n'est pas parce que vous avez une clearance sur un livre que ce livre vous est "réservé" pendant une quelconque période de temps.

Créer un compte sur PGLAF

L'étape suivante est de créer un compte sur PGLAF (la branche de PG qui s'occupe des clearances). Si vous êtes déjà PPV ou si vous avez le statut "Direct Uploading", vous avez déjà un compte sur PGLAF).

Pour créer un compte sur PGLAF, allez sur leur page d'accueil et lisez l'introduction. Cliquez sur le lien New username et remplissez les champs. Veillez à indiquer une adresse email valable, car c'est par elle que vous recevrez avis que les clearances ont été accordées, ainsi que les messages au cas où plusieurs personnes travailleraient sur le même livre simultanément.

Soumettre une demande de clearance

Une fois que vous avez un compte sur PGLAF, logez vous et cliquez sur Submit a New Clearance Request. Le formulaire doit être rempli, en général avec des informations présentes sur la page de titre (sinon vous devrez faire plus de recherche). Veillez à mentionner la source de toute information non présente sur la page de titre et son verso. Si plusieurs dates apparaissent dans différents contextes (par exemple, date de publication et date de copyright), entrez chacune des dates.

Les images jointes doivent avoir une taille réduite (100 k est un maximum raisonnable) mais tout le texte, même les petits caractères, doit être lisible. Les œuvres en plusieurs volumes peuvent faire l'objet d'une seule demande de clearance si la date est la même, ou si vous fournissez les pages de titre et verso du premier et dernier volume.

Types de clearance

Il y a plusieurs types. La règle la plus courante est la règle 1, mais parfois d'autres règles sont employées.

Cas usuel (Règle 1)
Le livre est libre de droits (entré dans le domaine public) par l'expiration des droits. C'est le cas des livres initialement publiés avant 1925. Si le livre n'a pas de date de copyright, il faudra faire certaines recherches, par exemple trouver un catalogue (ou deux) d'une bibliothèque sérieuse qui indique la date: le catalogue de la bibliothèque du Congrès, le British Library Public Catalogue, le catalogue de Gallica, etc.
Absence d'indication de copyright (règle 5)
C'est le cas des œuvres distribuées aux Etats-Unis, en un nombre significatif d'exemplaires, avant le 1er mars 1989, sans indication de copyright, et dont tous les auteurs sont américains, ou qui ont été publiées en premier aux Etats-Unis (cette règle ne s'applique pas aux livres imprimés ou publiés en dehors des U.S.)
Non-renouvellement (Règle 6)
L'application de la règle 6 est pour l'instant suspendue. Il s'agit de montrer que le copyright n'a pas été renouvelé, en fournissant des preuves de recherche dans les divers recueils de renouvellement de copyright (en faisant attention aux coquilles dans ces recueils). Voir le Rule 6 Howto.
Publication du gouvernement (Règle 8)
Aux Etats-Unis il n'y a pas de copyright sur les œuvres créées par le gouvernement fédéral. Il faut néanmoins prouver que l'ouvrage a été créé par le gouvernement et non simplement pour lui. Ce n'est pas valable en général pour des œuvres créées aux U.S. par les gouvernements locaux ou d'états (qui ne sont pas le gouvernement fédéral des U.S.), ni aux œuvres de gouvernements étrangers (par exemple dans le cas du Royaume Uni ou du Canada, il y a un copyright de 50 ans).
Autres
Les autres cas sont très rares et ne sont pas détaillés ici. Voir le Copyright Howto.

Attendre

Il ne reste alors plus qu'à attendre. Les demandes de clearance usuelles selon la règle 1 sont en général traitées en quelques semaines. Les clearances selon la règle 6 prennent plus de temps, car il y a des recherches à faire, et peuvent nécessiter des investigations supplémentaires de votre part. Vous devez obtenir la clearance avant de déposer les fichiers sur les serveurs de DP.

Il se peut que la réponse soit négative. Une raison du refus sera toujours donnée. Si vous pensez que le refus est dû à des raisons techniques (par exemple, un fichier incorrect ou corrompu), vous pouvez bien sûr re-soumettre votre demande après avoir résolu le problème.

Obtenir les scans

Il y a deux façons d'obtenir les images des pages: les scanner soi-même, ou bien les récupérer d'une source qui les a déjà scannées.

Scanner

Pour le texte du livre, le mieux est de scanner depuis le logiciel d'OCR. La plupart des systèmes d'OCR utilisent des traitements très efficaces pour le texte, mais qui détériorent les illustrations: dans ce cas il vaut mieux, quand il y a peu d'illustrations, scanner le texte en noir et blanc, et re-scanner les illustrations à part (en couleur pour les illustrations en couleur, et au moins en niveaux de gris pour les illustrations en noir et blanc ou en niveaux de gris). Il est bon de scanner également la couverture et le dos, quand ils sont illustrés. Scannez également les publicités s'il y en a dans le livre.

Il est recommandé de scanner les images des pages en 200-400 DPI (selon la police de caractère). Les illustrations doivent être scannées à une plus haute résolution (600 DPI convient en général).

La première fois que vous utilisez votre scanner, regardez s'il utilise la technique du faux dégradé (anglais "dithering"). Cette technique produit l'illusion de couleurs non disponibles en déplaçant des pixels. La première image a été traité en faux gris, et est plutôt plus lisible, mais ça augmente la taille du fichier et ne donne pas de bons résultats à l'OCR. La seconde est seuillée (anglais "thresholded"), ce qui est la meilleure méthode. Si votre pilote de scanner fait du faux dégradé, envisagez de scanner en niveaux de gris et de laisser votre logiciel d'OCR convertir en noir et blanc.

Image en faux dégradé
Image seuillée


D'une manière générale il est déconseillé de retirer les "poussières" (anglais: "despeckle"), car souvent on risque de perdre les signes de ponctuation. Si vous trouvez qu'un tel dépoussiérage améliore la qualité de l'OCR, alors pourquoi pas, mais utilisez les versions sans dépoussiérage pour les scans destinés à la relecture.

Conseils

Fournisseurs d'images

Il existe de nombreuses archives d'images qui fournissent sur internet des images de livres du domaine public. Il y a une liste ici.

Abstenez-vous d'utiliser des scans provenant d'archives dont l'utilisation est payante. En général ces archives ajoutent un copyright sur leur compilation, ou imposent certaines restrictions. Respectez les condition d'emploi de ces archives: nous voulons garder des relations de bon voisinage. Les bonnes manières veulent que nous mentionnons dans les Crédits les sources des scans, donc il faut s'assurer que le responsable de projet en a connaissance. Au moment de créer le projet sur DP, utilisez le champ "image provider" à cet effet. Il est bon également d'indiquer à PG la provenance des images lors de la demande de licence, mais ce n'est pas une obligation.

DP accepte uniquement les images au format PNG et JPG pour l'interface de relecture. Si les images récupérées de votre source sont dans un format différent, vous devrez les convertir au cours de votre préparation. Si la conversion a produit des images de moins bonne qualité, vous pouvez envisager d'ajouter un lien vers les meilleures images dans les commentaires du projet.

Certains programmes ont été écrits par des membres de DP pour facilitee la récupération d'images:

Scanners

À vous de voir quel scanner correspond le mieux à vos besoins.

OCR

Vous avez les scans, il faut maintenant faire le texte. (L'alternative est le projet type-in, pour lequel il n'y a pas de texte). Il y a de nombreux logiciels d'OCR, certains très bons, d'autres très mauvais, dans toutes les gammes de prix.

Note: Depuis la séparation entre les tours de relecture et les tours de formatage, il est déconseillé d'introduire du pré-formatage (marquages <i>, etc.), qui ne pourrait que rendre le travail plus difficile pour les relecteurs.

Abbyy FineReader

Le logiciel le plus populaire est ABBYY FineReader. Il fait un excellent travail, et les versions antérieures sont disponibles sur eBay à prix modiques. Essayez de vous procurer une version Pro. Les versions Home et Sprint sont moins chères, mais ont beaucoup moins de fonctionnalités. Il vaut mieux obtenir la précédente version Pro que la dernière version Home.

Autres logiciels d'OCR

Voir Content Providing FAQ#Other OCR Software.

Le Pool OCR

Si vous n'avez pas de logiciel d'OCR, ne voulez pas vous embêter avec ça, ou simplement avez besoin d'un logiciel de pointe ou d'un travail d'expert, vous pouvez utiliser le pool OCR. Ce groupe prend vos scans et produit à partir de ça le texte.

Vérifier le projet

  • Vérifiez que l'image de chaque page est présente, et complète. Incluez toutes les pages, y compris le titre, le verso, toutes les illustrations, les planches et les pages blanches. Retirez les pages blanches avant la première page imprimée et après la dernière page. S'il manque des pages, ou si des pages sont endommagées, remplacez-les ou réparez-les avant de poursuivre.
  • Vérifiez que chaque page a été OCRisée. Il vous faut un fichier texte par image, avec le même nom de base (par exemple: 001.txt et 001.png). (Si vous créez un projet en type-in, utilisez des fichiers textes vides.)
  • Les fichiers texte et image doivent être nommés de façon que le tri alphabétique standard mette les pages dans l'ordre dans lequel elles apparaissent dans le livre imprimé:
    • Une convention courante est de numéroter tout à partir de 001 (ou 0001 s'il y a plus de 999 pages). Typiquement dans ce cas ce numéro de série ne coïncidera pas avec le numéro imprimé sur chaque page, mais l'écart sera en général constant. Vérifiez que l'écart est constant et investiguez chaque anomalie, qui peut être due à des pages manquantes ou en double. L'écart peut ne pas être constant à cause d'illustrations hors texte, d'inserts, etc. Ne déplacez pas ces inserts dans le seul but d'obtenir un écart constant.
    • Une autre possibilité est de nommer les fichiers conformément au numéro de page imprimée, en utilisant des caractères supplémentaires dans le nom de fichier. Pour les pages, le nom de fichier (en .txt, .png ou .jpg) peut avoir au maximum 12 caractères, donc en pratique le nom de base peut avoir jusqu'à 8 caractères. Les caractères autorisés sont: les chiffres, lettres, caractère souligné, tiret, et point. Ne supposez pas un ordre particulier entre les minuscules et majuscules, en pratique utilisez tout en minuscule (ou tout en majuscules).

Préparer les illustrations

Les illustrations doivent être scannées en haute résolution, en couleurs ou en niveaux de gris selon l'illustration, depuis une application autre qu'Abbyy Finereader (dont les traitements adaptés au texte dégradent les illustrations).

Les illustrations devraient être scannées avec une résolution suffisante pour capturer les détails les plus fins. Même si une résolution importante n'est pas utile aujourd'hui pour un fichier HTML affiché à l'écran, elle peut permettre l'impression du livre sur papier, et être utile si les technologies des écrans s'améliorent. En général, 300 DPI en niveaux de gris suffisent pour des dessins au trait, ou des images en dégradé continu. Les photographies tramées ont souvent besoin de 600 DPI pour éviter les effets de moiré.

Rognez ensuite autour de l'illustration, en laissant suffisamment d'espace autour de l'illustration pour permettre de la nettoyer ou de la faire pivoter. Ne vous sentez pas obligé de fournir des illustrations parfaitement nettoyées et pivotées, prêtes à l'emploi. Cela peut être fait par le PPer. Néanmoins si vous avez envie et vous sentez capable de nettoyer les illustrations, ce sera apprécié par de nombreux PPer ; si vous le faites, laissez toujours les images plus grandes que leur taille finale, afin de permettre au PPer de les redimensionner à la taille de son choix.

Comment préparer les planches?

Dans le cas des illustrations hors texte, conservez une version en noir et blanc de l'illustration (et de la page blanche au verso) avec les images des pages, positionnées à l'endroit où figure l'illustration dans le livre original (même si l'illustration et son verso ne sont pas comprises dans la numérotation des pages).

GuiPrep

GuiPrep est un logiciel créé pour DP par Thundergnat. Cet outil fantastique prend le résultat de l'OCR, corrige les erreurs d'OCR les plus courantes (en anglais) et émet des fichiers texte prêts à l'emploi pour DP. GuiPrep renumérote également les fichiers images, et optimise leur taille avec pngcrush. Ce logiciel très pratique se trouve à cet endroit.

Vous pouvez utiliser l'outil de post-processing Guiguts pour importer les fichiers textes en un document unique (option "File, Import Prep Text Files"), ce qui permet ensuite de lancer des traitements de type correction orthographique pour établir une liste initiale de mots corrects.

GuiPrep contient de nombreuses options. Ne vous laissez pas impressionner. La plupart n'ont pas besoin d'être modifiées, et ne servent que pour des textes particuliers pour lesquels les options par défaut ne donnent pas de bons résultats. Nous décrivons ici uniquement les bases, pour plus d'information référez-vous au manuel sur le site de GuiPrep, ou demandez dans le forum «Providing Content».

Utilisation de GuiPrep

Voici les bases. Les instructions détaillées figurent sur la page d'accueil de GuiPrep.

Obtenir les fichiers texte

Depuis le logiciel d'OCR, créez deux versions de sortie texte. Créez la première version dans un dossier nommé "textw" dans le répertoire de votre projet, en enregistrant le texte avec les options suivantes : "Rich Text Format", Create a separate file for each page, Remove all formatting, Keep page breaks et Keep line breaks. Le nom de fichier lui-même n'a pas d'importance.

Pour la seconde version, faites comme pour la première, mais enregistrez-la dans le répertoire "textwo", en retirant les options Keep line breaks... «and you should remove hyphens».

Cela permettra à GuiPrep de rejoindre les mots scindés en fin de ligne.

Si votre logiciel d'OCR ne fournit pas ces options, sauvegardez au format texte. Assurez-vous que les fichiers contiennent les sauts de ligne et utilisent une ligne blanche pour marquer la séparation entre paragraphes. Vous devrez aussi retirer les options "Extract" et "Dehyphenate" dans l'onglet "Process Text" de GuiPrep.

Lancer GuiPrep

Vous devez avoir à ce stade dans votre répertoire de projet trois répertoires : "pngs" (avec les scans des pages au format png), "textw" avec les fichiers rtf (ou txt) avec les sauts de ligne, et "textwo" avec les fichiers rtf (ou txt) sans sauts de ligne.

Lancez GuiPrep, utilisez l'onglet "change directory" et sélectionnez le répertoire de votre projet.

Dans l'onglet "process text", vérifiez que les options souhaitées sont sélectionnées. Si votre projet inclut des s longs (et est en anglais?), utilisez l'option "Fix Olde Englifh", ce qui lancera une vérification supplémentaire pour les confusions entre f et s (ne choisissez cette option que si vous avez des s longs).

Cliquez sur "start". Quand GuiPrep a fini, il indiquera "Finished all selected routines" (tous les traitements demandés sont achevés).

On connaît des cas de caractères unicode réapparaissant après l'usage des outils de recherche et de remplacement; il est possible de relancer l'option "convert to ISO 8859-1" après avoir lancé des recherches et effectué des remplacements.

Une fois que les fichiers texte sont prêts, vous pouvez typiquement utiliser guiguts (option "File, Import Prep Text Files") pour lancer le correcteur orthographique et établir une liste initiale de mots corrects.

FAQ, ou questions diverses

Quelle est la différence entre un Fournisseur de Contenu et un Responsable de Projet?

  1. Le Fournisseur de Contenu fournit les images des pages et des illustrations, pour traitement sur DP. Optionnellement il fournit le texte avant relecture. Enfin il trouve une personne (ou lui-même) pour prendre la suite. Il n'est pas nécessaire que le fournisseur de contenu soit membre de DP.
  2. Le responsable de projet crée le projet sur DP, le mène à travers les différents tours de relecture et de formatage requis et appropriés pour le projet, répond aux questions des relecteurs/formateurs, prend les décisions visant à assurer un résultat le plus homogène possible en final pour le post-processeur. Les responsables de projet peuvent fournir leur propre contenu ou récupérer des scans de fournisseurs de contenu.

Combien de temps cela me prendra?

Ça dépend du livre. Pour un court roman sans illustrations, il faut compter une heure ou deux pour le scanner, passer à l'OCR, vérifier et préparer le projet. A l'inverse, pour un traité de milliers de pages sur l'architecture navale, avec 33 planches de grandes dimensions et 200 illustrations, vous pouvez mettre une année rien qu'à scanner le livre.

Quelles sont les qualifications requises?

Il n'y a besoin d'aucune compétence particulière. Vous devez être capable de produire les images en bonne qualité, et de trouver un responsable de projet qui veille prendre la suite.

De quel matériel dois-je disposer?

  • un scanner adapté au type de livres que vous voulez traiter. Certaines bibliothèques ont des scanners en libre service.
  • Un logiciel d'OCR capable de fournir le texte. Ou alors utiliser les services des volontaires du pool OCR.
  • Un logiciel similaire à GuiPrep. Si vous faites appel au pool OCR, les volontaires peuvent lancer GuiPrep pour vous si vous demandez poliment.

Y a-t-il des deadlines?

Il n'y a aucun calendrier imposé. C'est vous qui décidez quel temps passer sur les livres qui vous intéressent.

Quels fichiers dois-je fournir?

Il faut fournir une image claire, lisible et peu volumineuse (en terme de taille de fichier) de chaque page. Chaque image doit être suffisamment grande (en terme de pixels) pour être lisible facilement, mais en même temps suffisamment réduite (taille de fichier) pour être téléchargée rapidement même sur un modem. On considère en général qu'une image de moins de 100k est acceptable. Dans la majeure partie des cas une image en noir et blanc au format png, d'une largeur de 1000 pixels, est amplement suffisante.

Il faut également fournir pour chaque page un fichier texte contenant le résultat de l'OCR. Les noms du fichier texte et du fichier image doivent être identique à l'exception de l'extension (par exemple: 005.png et 005.txt) sans quoi le système ne saura pas quoi faire des fichiers au moment où ils sont déposés sur le serveur.

Si le livre contient des illustrations, ou une couverture décorée, il faut fournir pour chaque illustration une image à haute résolution en couleur ou en niveau de gris. A défaut de couverture décorée, il est demandé d'inclure une image en haute résolution de la page de titre, pour qu'elle puisse servir partiellement ou en totalité pour créer la couverture des formats EPUB. En général le mieux est le format jpg (à défaut dans certains cas, png, comme dans le cas d'illustrations en noir et blanc). Les post-processeurs apprécient si les fichiers d'illustration sont nommés selon le nom de fichier de la page elle-même: par exemple, i005-1.jpg et i005-2.jpg étant les illustrations de la page 005.png.

To comment or request edits to this page, please contact Monicas wicked stepmother or DACSoft.

Return to DP Official Documentation Menu