WebWorld-Participer
English

Programme Mémoire du Monde


Retour Sommaire Suite

Annexe D ASPECTS TECHNIQUES DE LA PRESERVATION

RECOMMANDATIONS DU SOUS-COMITE DE LA TECHNOLOGIE

Préface

Les membres du sous-comité de la technologie tiennent à exprimer leur gratitude aux personnes qui les ont aidés de leurs conseils et observations concernant ce document.

Le sous-comité étant toutefois l'unique auteur des conclusions finales et du dernier libellé des recommandations, les éventuelles erreurs contenues dans le présent document ne doivent en aucun cas être imputées à nos conseillers.

Il convient de noter par ailleurs que les recommandations sont valables pour la date actuelle.

Elles portent essentiellement sur la numérisation et les possibilités qu'elle offre d'améliorer l'accès aux documents de tous ordres, y compris les manuscrits et autres textes, les enregistrements sonores et les images, ainsi que leur préservation. Leur objet est d'encourager l'étude des avantages de la numérisation tout en mettant en évidence qu'il ne s'agit pas d'une panacée permettant de résoudre tous les problèmes de conservation des fonds documentaires.

En particulier, le sous-comité de la technologie tient à indiquer clairement que les méthodes traditionnelles de conservation utilisées pour maintenir les documents en état de servir ne deviendront pas caduques du fait du lancement d'un programme de numérisation. La numérisation complète d'une collection prendra souvent des années ; aussi est-il indispensable de poursuivre les programmes de préservation des documents originaux. Dans la plupart des cas, la copie numérisée ne se substituera pas à l'original mais constituera un exemplaire de consultation acceptable pour la majorité des utilisateurs et contribuant en conséquence à réduire les facteurs d'usure de l'original.

Les copies de consultation sous la forme de microfilms et de photographies demeureront sans doute également nécessaires dans les cas où l'état actuel de la technologie numérique ne permettra pas d'effectuer des reproductions d'une qualité suffisante.

La technologie évolue cependant et les normes de numérisation ne cessent de s'améliorer. Ces recommandations doivent donc être considérées comme un projet de texte demandant à être régulièrement revu et mis à jour.

Divers préfixes servant aux scientifiques à exprimer la grandeur sont utilisés dans le présent document. On en indique brièvement ci-dessous la hiérarchie à l'intention des personnes auxquelles ces termes ne seraient pas familiers. Chaque préfixe désigne une grandeur mille fois supérieure à celle qui précède. Ces préfixes sont utilisés en combinaison avec les mots bit - chiffre binaire - ou octet (o) - groupe de 8 chiffres binaires.
Kilo (K)103 Mille
Méga (M)106 Mille kilo ou un million
Giga (G)109 Mille méga ou un milliard
Téra (T)1012 Mille giga ou un billion
Péta (P)1015 Mille téra
Exa (E)1018 Mille péta


Up

1. Résumé

Le sous-comité de la technologie du Comité consultatif international du programme Mémoire du monde :

Ayant examiné les avantages présentés par les différentes technologies actuellement disponibles,

Conscient de l'accroissement de la demande de consultation des documents,

Mais conscient également des risques d'endommagement que leur fait courir une utilisation excessive,

Constatant par ailleurs la nécessité de réaliser des copies de préservation de nombreux documents en péril,

Tenant compte du fait que de nombreux supports analogiques de données ont une durée de vie limitée et qu'il faut recopier l'information qu'ils contiennent afin de la sauvegarder en prévision de l'avenir lointain,

Mais considérant également que la copie de type analogique se traduit inévitablement par une perte de qualité,

Et tenant compte de ce qu'à l'heure actuelle les documents ne se prêtent pas tous à la reproduction sur un nouveau support,

Suggère qu'un programme de numérisation des documents représente la meilleure solution de compromis permettant de répondre aux demandes conflictuelles d'élargissement de l'accès aux collections et d'amélioration de la protection des documents.

Le sous-comité de la technologie recommande en conséquence que les conservateurs de toutes les collections examinent de près les avantages qui pourraient résulter, pour celles dont ils ont la garde, de la création de copies numériques des documents.

Up

2. Remarques liminaires

(a) Limites des recommandations

Les exigences techniques que devrait satisfaire le catalogue d'une collection numérisée ne font pas encore l'objet d'un accord. Il est évident que ce type de catalogues peut offrir des avantages dont les catalogues traditionnels sont dépourvus, en particulier en ce qui concerne les images et enregistrements sonores. On peut, par exemple, y intégrer un système actif de pointeurs renvoyant d'un document à des documents connexes. Un débat des documentalistes aboutissant à la définition des caractéristiques requises des catalogues permettrait au sous-comité de la technologie d'inclure celles-ci dans ses recommandations techniques.

(b) Exceptions à la numérisation

Le sous-comité de la technologie reconnaît qu'il n'est pas souhaitable, à l'heure actuelle, de numériser certaines catégories de documents. Les raisons en sont variables. Ainsi, le stockage numérique des films cinématographiques demande trop d'espace de mémoire pour qu'il soit possible de l'effectuer de manière économique en l'état actuel de la technologie ; par ailleurs, les cartes et plans de grandes dimensions n'entrent pas dans les scanneurs existants.

En outre, il existe des documents dont la valeur transcende celle de l'information qu'ils contiennent. L'art dont témoignent les manuscrits enluminés et l'importance historique de documents tels que la Grande Charte d'Angleterre ou la Déclaration d'indépendance des Etats-Unis les fait sortir de la catégorie des simples supports d'information. De même, davantage encore de documents modernes - photographies d'art, films, enregistrements sonores -comptent parmi les pièces de valeur de nombreuses collections. La réalisation d'une copie numérique de ces documents ne rendra pas justice à tous les éléments de leur aspect et de leur nature mais réduira toutefois les facteurs d'usure auxquels les soumet une utilisation excessive.

(c) Urgence

Il faut de toute urgence créer un nouveau système de stockage de certains types d'enregistrements sonores et images en mouvement. Leurs supports sont en effet chaque jour plus nombreux à se dégrader au-delà de toute possibilité de restauration. C'est un nouvel "incendie de la Bibliothèque d'Alexandrie" qui se déroule lentement sous nos yeux. Les livres, les manuscrits et les estampes se détériorent également. La question est maintenant de savoir non plus "si" ces supports d'information vont disparaître mais "quand" cela va se produire. Certains supports sont appelés à survivre pendant des milliers d'années. Beaucoup ne durent que quelques milliers de jours. Pour sauvegarder l'information qu'ils contiennent, il faut la recopier.

(d) Préservation des documents originaux

Le sous-comité souligne que la mise en place d'un vaste programme de numérisation ne doit pas être considéré comme le prélude au lancement d'un programme d'élimination des supports originaux. Dans le cas de nombreuses collections, la numérisation servira avant tout à améliorer l'accès aux documents. Les copies numériques faciliteront la sauvegarde du document original en réduisant le nombre des demandes de consultation le concernant et donc des facteurs d'usure auxquels il sera soumis.

A l'heure actuelle, les documents ne se prêtent pas tous à la réalisation d'une copie numérique d'une qualité suffisante. De légères distorsions et pertes risquent de se produire. Il faudra donc pouvoir disposer des originaux à la date à venir où les progrès de la technologie permettront d'apporter les améliorations nécessaires à la qualité de la reproduction et de la numérisation.

Sans doute existe-t-il des documents, en particulier dans les domaines du son et des images en mouvement, dont il est rationnel d'éliminer les originaux après numérisation car leurs supports sont trop abîmés pour qu'il soit possible de les conserver. Cependant ce n'est pas là la règle normale.

(e) Recommandation concernant la technologie de la numérisation

Le sous-comité n'est pas en mesure de formuler une unique recommandation catégorique sur le type de matériel de numérisation ou le support de mémoire à utiliser. Cette question doit être étudiée par les conservateurs des collections au moment de l'évaluation des besoins de chaque institution. Certains des points à examiner sont indiqués ci-dessous, de même que certaines normes techniques minimales auxquelles le matériel et le procédé de reproduction doivent satisfaire. Les membres du sous-comité de la technologie sont prêts à donner leur avis sur des questions précises et à recommander des spécialistes susceptibles de jouer le rôle de conseillers pour les projets qui requièrent une assistance plus poussée.

L'état des techniques ne cesse d'évoluer et le sous-comité de la technologie a l'intention d'en poursuivre l'étude.

Up

3. La numérisation

(a) Numériser : pourquoi faire ?

La demande de consultation des documents s'accroît, augmentant à son tour le risque qu'ils soient endommagés aussi bien graduellement que de manière brutale et catastrophique. Même si de nombreux types de dégâts sont réparables, les dépenses en jeu peuvent être énormes. Et lorsque les dommages causés sont graves, en particulier s'agissant des supports du son et des images en mouvement, le document se trouve détruit de fait.

Numériser un document permet de satisfaire les demandes de consultation de la majorité des usagers en mettant à leur disposition la copie numérisée. Beaucoup d'utilisateurs souhaitent en effet étudier le contenu des documents et n'ont pas besoin d'en examiner le support initial.

En outre, dans le cas de nombreux documents, il est également possible d'effectuer une copie numérisée de meilleure qualité qui peut constituer une copie de sauvegarde de l'original.

(b) Avantages de la numérisation

Le sous-comité de la technologie estime que les principaux avantages potentiels de la numérisation sont les suivants :

(i) Reproduction - il est possible de réaliser des copies de l'information déjà numérisée en utilisant soit le même format de stockage soit un autre format numérique, sans perte de qualité.

(ii) Automatisation - sont automatisés non seulement la restitution des éléments demandés par les chercheurs, grâce à l'utilisation de systèmes de stockage robotisés, mais aussi le processus de reproduction. Le document étant représenté par une chaîne de chiffres binaires, il est possible d'automatiser la copie, voire de se passer d'en vérifier la fidélité au moyen d'une intervention humaine.

(iii) Contrôle et réparation automatiques - dès lors que la reproduction de l'information numérique peut être automatisée, il doit devenir possible de contrôler automatiquement l'état de la collection, et, si des erreurs excessives sont décelées sur un support numérique, de réaliser une copie corrigée du document sans intervention humaine.

(iv) Recherche - la numérisation offre la possibilité d'effectuer des recherches dans les catalogues aussi bien locaux que lointains et de créer un tissu (web) de liens ou de pointeurs renvoyant du document consulté par l'utilisateur à des documents connexes de la même collection ou d'autres. Des recherches de texte intégral peuvent en outre être effectuées. Des techniques de recherche analogues sont actuellement élaborées pour les documents sonores et les images.

(v) Accessibilité - elle tient à la capacité d'envoyer un signal numérique sur les réseaux de télécommunications sans perte de qualité. L'utilisation de systèmes de stockage robotisés de grande capacité rend la collection numérisée accessible 24 heures sur 24 avec un minimum de personnel.

(vi) Rapidité de la copie - dans le domaine numérique, il est possible de recopier fidèlement ou de transférer des données à une vitesse très élevée. Une copie sur support papier peut être fournie rapidement au chercheur. Le futur transfert des collections sur de nouveaux supports sera beaucoup plus rapide que le passage initial à la numérisation.

(vii) Qualité - elle tient à la possibilité de numériser un document avec une très forte ou une faible résolution, selon les besoins. Il est également très facile de réaliser des copies de qualité inférieure à partir de la copie de haute qualité chaque fois que nécessaire.

(viii) Espace nécessaire - la haute densité du stockage de l'information sur les supports numériques peut se traduire par une réduction majeure de l'espace de rayonnage nécessaire. D'où, également, une réduction de l'espace nécessitant une régulation climatique conforme aux normes archivistiques et, en conséquence, un abaissement des frais de fonctionnement.

(ix) Futurs transferts de la collection - si une collection est copiée sur un support analogique, le coût de ses futurs transferts sera identique (sous réserve de l'inflation) à celui de cette première reproduction. Si elle est copiée sur un support numérique, on pourra, lors des futurs transferts, tirer parti des possibilités de recopie automatisée inhérentes au numérique (voir les points 3 (b) (i) et (ii) ci-dessus).

Le transfert de collections de données numériques n'est pas un phénomène nouveau. Les milieux bancaires, par exemple, ont transféré plusieurs fois avec succès leurs banques de données. Leur expérience peut offrir des enseignements utiles pour le transfert de l'information textuelle, visuelle et sonore.

(c) Inconvénients de la numérisation

Le principal inconvénient perçu par de nombreuses personnes est son coût. Les idées à ce sujet peuvent être résumées sous quatre rubriques :

(i) Investissement initial - le matériel nécessaire pour effectuer la numérisation peut être coûteux et demande souvent à être utilisé par des opérateurs qualifiés pour donner les meilleurs résultats.

(ii) Contraintes de rangement - on croit souvent que les supports utilisés pour stocker l'information numérisée devront être conservés dans un environnement très propre et très stable sur le plan climatique, ce qui accroîtra la consommation d'énergie imputable à la collection. L'aménagement de cet espace de rangement à l'atmosphère stabilisée exigerait en outre un investissement initial.

(iii) Frais de fonctionnement - on craint qu'une collection numérisée ne doive elle aussi être fréquemment recopiée, avec les coûts de main-d'oeuvre, d'énergie et d'achat de nouveaux supports que cela implique et que la survie de l'information numérique ne soit pas garantie au-delà de deux à trois ans si elle est stockée sur bande magnétique et de trois à cinq ans si elle est conservée sur disque optique.

(iv) Coûts de préparation - un document doit être préparé pour la saisie numérique. Outre l'éventuelle préparation physique requise, le contenu initial doit en être classé et indexé et les références textuelles introduites dans la base de données par du personnel spécialisé, opérations qui peuvent être coûteuses. On pense que la copie de l'information des supports existants sur de nouveaux supports implique d'importantes contraintes de main-d'oeuvre.

Le sous-comité de la technologie a examiné ces points et formulé les observations et suggestions suivantes :

(i) De petits services d'archives et de bibliothèques peuvent éventuellement se grouper pour mettre en commun un ensemble d'installations de numérisation. Après l'opération majeure de saisie initiale, la numérisation peut être un processus relativement intermittent dans les petites institutions. Les grandes collections dotées d'un programme intensif d'accroissements devront nécessairement posséder leur propre matériel.

Les coûts d'équipement à consacrer à un programme de numérisation doivent également être comparés aux économies qui pourront être faites sur les coûts de préservation/restauration. Ces économies seront rendues possibles par la concentration des ressources affectées à la préservation de la collection sur les documents dont la valeur ne tient pas seulement à leur caractère de supports d'information. Le stockage numérique est le seul moyen de sauvegarder sans distorsion pendant des millénaires l'information contenue sur nombre de supports en voie de dégradation.

(ii) Les disques optiques et les bandes magnétiques qui sont utilisés dans les systèmes de numérisation actuellement disponibles n'exigent pas une propreté ou une régulation climatique extrêmement rigoureuses. A supposer qu'il faille aménager une zone de rangement conformément à des normes très strictes de ces deux points de vue, elle sera de taille très réduite comparée aux espaces de rayonnages traditionnels.

(iii) Les premiers formats de stockage sur bandes informatiques étaient dépourvus des dispositifs perfectionnés de protection contre les erreurs dont les formats modernes sont dotés. En outre, les bandes ne se présentaient pas sous la forme de cassettes ou cartouches et étaient donc endommagées en cas de manipulations peu soigneuses. Les banques et les autres institutions qui ont utilisé ces premiers formats de bandes magnétiques recopiaient celles-ci à des intervalles rapprochés pour éviter les erreurs auxquelles les systèmes de correction simple de l'époque ne pouvaient parer.

Beaucoup de professionnels de la télévision s'emploient actuellement à recopier sur des supports numériques leurs vieilles bandes vidéo datant de la fin des années 50. Ils y sont poussés par l'obsolescence des machines et, dans certains cas, par la dégradation des supports. L'instabilité des particules magnétiques contenant l'information n'entre pas en ligne de compte.

A l'issue d'amples recherches sur les aspects économiques à long terme de la recopie de leurs collections, ces professionnels sont parvenus à la conclusion que les formats de bandes vidéo numériques modernes leur offraient le meilleur moyen de préserver le contenu de leurs vidéogrammes. Ces bandes et les systèmes de correction d'erreur qu'elles comportent pourraient également servir au stockage d'autres formes de documents incluant des textes, des images fixes et des sons.

Des facteurs tels que la fréquence d'utilisation et le milieu d'entreposage influent sur la durée de vie des bandes. Les bandes souvent consultées ont une durée de vie plus brève que la normale, mais il est probable que le nombre en est relativement faible. Des duplicatas des articles très demandés pourraient par ailleurs être conservés.

Les disques optiques existent sous la forme de CD du commerce depuis maintenant plus de dix ans. Le nombre des cas de perte de l'information qui y était stockée est infime. Les cas signalés s'expliquaient le plus souvent par le caractère corrosif de l'encre utilisée pour imprimer les étiquettes des disques, encre qui a altéré les données numériques. Le problèmes a été décelé et résolu rapidement.

L'emploi d'un système de stockage robotisé permet de réduire fortement les coûts de vérification des supports et de reproduction. Certains systèmes robotisés sont déjà dotés d'une fonction de vérification automatique qui décèle les erreurs sans intervention humaine. La reproduction automatique sans intervention humaine est également réalisable et n'entraîne pas d'autres coûts que celui du nouveau support nécessaire pour effectuer la copie.

(iv) Pour microfilmer des documents, il faut bien aussi les préparer et les restaurer avant de les photographier. Dans bien des cas, les documents à numériser ne demandent pas de remise en état matérielle préalable. Leur "restauration" peut souvent être effectuée plus efficacement et à meilleur coût sous la forme électronique, au moment de la consultation de l'information. Cela permettra également de tirer parti des futures améliorations des techniques "d'autopsie" documentaire qu'il pourrait être impossible d'appliquer à des pièces ayant subi une restauration matérielle. Des dégradations telles que la perte des contrastes, les bavures d'encre, les colorations, les taches, etc. survenues au cours de l'existence d'un document font partie de son histoire. C'est pourquoi il est fortement recommandé de le "restaurer" sous une forme numérique plutôt que par des méthodes physiques dont l'effet sera permanent.

Les compétences requises des opérateurs appelés à effectuer la numérisation se situent au même niveau que celles exigées du personnel chargé du microfilmage. Un certain recyclage sera nécessaire mais l'élément coût de personnel ne devrait pas varier sensiblement. En outre, il sera peut-être possible d'automatiser partiellement la saisie.

(d) Facteurs de coût et de qualité en matière de numérisation

La réalisation d'une copie d'un support analogique classique sur un nouveau support
- qu'il soit analogique ou numérique - est coûteuse. Il faut faire appel à du personnel spécialement formé qui puisse surveiller et régler les opérations pour assurer que la qualité du transfert soit optimale. La qualité technique de la copie analogique réalisée à partir d'un original analogique est inférieure à celle de l'original et se dégrade régulièrement à chaque recopie.

Sur certains types de support, cette dégradation peut passer inaperçue en raison de la redondance intrinsèque de l'information. C'est particulièrement vrai dans le cas des textes imprimés qui ne deviennent illisibles que lorsque les erreurs sont très importantes. Sur d'autres types de support d'information, une dégradation même minime entraîne une perte de qualité évidente.

La copie d'un support numérique sur un autre support numérique permet d'automatiser à la fois les éléments mécaniques de l'opération et sa surveillance. La qualité technique de la copie numérique effectuée à partir d'un original numérique est identique à celle de l'original.

(e) Copies de consultation et de préservation

Au cours des débats du sous-comité de la technologie, une divergence de vues fondamentale s'est fait jour entre les deux groupes de travail chargés, respectivement, des textes et images fixes et des enregistrements sonores et images en mouvement. Pour le premier groupe, la numérisation est avant tout un outil de consultation. Le second y recherche plutôt un moyen de confectionner des fac-similés de haute qualité dans un but de préservation. Ce fait n'enlève pas leur valeur aux recommandations du sous-comité mais renforce au contraire la nécessité d'un dialogue. Un même système de reproduction numérique produisant des copies d'une fidélité modulable permettra d'améliorer à la fois l'accès aux documents et leur préservation.

Pour certaines collections, les supports de mémoire fabriqués en grande série tels que les CD-ROM et les CD réinscriptibles (CD-R), distribuables physiquement aux utilisateurs si c'est jugé souhaitable, représenteront la meilleure solution. Les CD-ROM et les CD-R offrent un moyen raisonnablement bon marché d'aborder la numérisation ; par ailleurs, à mesure que la taille de la collection numérisée s'accroît, on peut mettre ces disques dans un chargeur automatique pour accélérer le service aux usagers.

D'autres collections feront mieux d'opter pour la mémoire robotisée de grande capacité téléconsultable par l'intermédiaire de réseaux. Le choix de la solution optimale variera d'une collection à l'autre. Dans certains cas, il faudra recourir à la fois aux supports fabriqués en série et à la mémoire robotisée.

(f) Limites de la numérisation

Comme indiqué ci-dessus, la numérisation présente deux limites principales :

(i) certains types de documents et en particulier les images en mouvement et les vastes collections de photographies fixes de haute qualité exigent un espace de mémoire énorme. La technologie du stockage numérique continue cependant de s'améliorer et le coût unitaire du stockage est en chute tandis que la capacité des systèmes de stockage s'accroît ;

(ii) la définition des copies numériques réalisées au moyen des technologies actuelles peut être insuffisante pour garantir la haute fidélité que requièrent certains types de documents.

(g) Dangers de la numérisation

Il ressort des observations faites ci-dessus que la numérisation n'est pas considérée actuellement comme un outil universel de préservation. La reproduction numérique de nombreux documents favorisera néanmoins leur sauvegarde en réduisant les pressions dont les originaux font l'objet.

La création d'une copie de consultation numérique n'autorise pas à négliger ou à éliminer le document original. Les organismes de financement des institutions de conservation doivent être bien conscients que la numérisation est, pour la majorité des documents, un moyen d'élargir à davantage de personnes l'accès à l'information (par l'établissement d'une copie de haute qualité) sans accroître les risques d'endommagement de l'original et les coûts élevés de restauration qu'ils impliquent.

Up

4. Normes

(a) Normes techniques

La reproduction numérique peut être réalisée conformément à différentes normes de qualité. Il faut donc, lors de l'examen de chaque document préalablement à la numérisation, décider de la norme technique optimale à lui appliquer spécifiquement.

S'agissant des documents stockables sous la forme d'images fixes, l'examen de l'information à numériser permet de distinguer différents niveaux d'exigence :

1. pour beaucoup de documents textuels, il suffit de s'en tenir à une norme de stockage en mode trait (en deux tons) de base - autrement dit de faire une photocopie numérique. Cette norme serait valable pour de nombreux livres et documents dactylographiés ;

2. pour numériser comme il convient les documents incluant des images monochromes et des photographies fixes, il faut appliquer une norme de stockage selon une échelle de gris - c'est-à-dire faire l'équivalent d'une photographie en noir et blanc ;

3. les documents comportant des couleurs, tels que les manuscrits enluminés et les cartes, ainsi que les pièces susceptibles de demander une étude du type "autopsie" exigent une numérisation "pleine couleur".

De par leur nature, les enregistrements sonores et les images en mouvement doivent être stockés selon différents niveaux de définition normalisés ; dans bien des cas, ces niveaux de définition ont toutefois déjà été fixés par des normes techniques internationales reconnues.

(b) Normes d'utilisation

Les conservateurs des collections doivent décider de la finalité de toute copie numérisée :

consultation de base - elle exige une copie consultable par tous, le document original restant disponible pour examen par les seuls spécialistes et chercheurs. Cette copie devra être propre à satisfaire les besoins de 95 % des usagers ;

usage intermédiaire - certaines collections auront besoin de copies afin, par exemple, de mieux protéger un document important ou très demandé en limitant, y compris pour les chercheurs et spécialistes, l'accès à l'original. La copie pour usage intermédiaire devra être propre à satisfaire les besoins de 99 % des usagers ;

fac-similé - s'il s'agit de remplacer un document très endommagé, la norme à appliquer sera celle de la préservation - c'est-à-dire de la réalisation d'un fac-similé aussi proche que possible de l'original. Celui-ci sera admis comme le duplicata du document original dont il constituera une copie de sécurité ou de préservation.

Une norme "catalogue" ou "mode balayage" (browse) sera peut-être également nécessaire. Il s'agirait par exemple de permettre aux utilisateurs d'accéder à des sons, des images ou des illustrations en se servant de copies de basse qualité comme instruments de recherche.

(c) Reconnaissance optique de caractères

Le recours aux systèmes de reconnaissance optique de caractères (ROC) plutôt qu'à la saisie d'images en mode trait pour numériser les textes a été examiné. Les systèmes de ROC présentent plusieurs avantages potentiels dont les principaux sont qu'ils demandent moins d'espace de mémoire numérique et permettent de consulter les textes directement sans devoir passer par un catalogue de mots clés. A l'heure actuelle, les logiciels de ROC sont d'une fiabilité et d'une utilité réduites. Les travaux sur ces systèmes se poursuivent et le développement à l'échelle commerciale de modèles capables, par exemple, de reconnaître dans des conditions limitées l'écriture manuscrite et de la transformer en caractères d'imprimerie est le signe d'un intérêt croissant du marché pour de secteur. Si les systèmes de ROC acquièrent une fiabilité suffisante, leur utilisation générera une quatrième norme technique applicable à la saisie des documents textuels.

(d) Compression des données et réduction des données

La compression des données (sans perte d'information) est acceptable lors de l'opération de saisie lorsque le manque d'espace de mémoire la rend indispensable. C'est un processus réversible : la décompression restitue le signal dans son intégralité.

La réduction des données, en revanche, est irréversible. Les inconvénients d'une copie numérique où les données auront été réduites n'apparaîtront peut-être que le jour encore indéterminé où l'on essaiera de la manipuler dans certains buts spéciaux, par exemple pour faire ressortir certaines couleurs facilitant la détection d'un filigrane ou d'une inscription partiellement effacée. La réduction des données n'est acceptable que si elle n'entraîne aucune perte décelable d'information cruciale susceptible d'être demandée par les utilisateurs. Elle peut être un moyen puissant et indispensable de faciliter la création de copies pour consultation et diffusion. Cependant, elle est inacceptable dans toutes les opérations en rapport avec la préservation.

Up

5. Conclusion

Le sous-comité de la technologie recommande que tous les conservateurs de collections envisagent la numérisation des documents comme un moyen d'améliorer l'accès à ceux dont ils ont la garde sans accroître simultanément les risques de détérioration des collections. Ils devraient aussi envisager d'y recourir, lorsque c'est nécessaire et/ou possible, pour créer des copies de sauvegarde de l'information.

Les avantages des programmes de numérisation à grande échelle sont largement supérieurs à leurs inconvénients. Le sous-comité de la technologie garde à l'étude les catégories de documents qu'il ne convient pas de numériser en raison des limites du matériel et des procédés actuellement disponibles ; de nouvelles recommandations seront faites de temps à autre à ce sujet.


Up

ANNEXE A

NORMES TECHNIQUES

Le sous-comité de la technologie a examiné longuement les normes techniques qui devraient être appliquées à la numérisation des documents. C'est là une question complexe en raison de la multiplicité des normes officielles et de fait actuellement en usage. Nous savons, en avançant les chiffres cités ci-dessous, que ceux-ci ne recueilleront pas l'approbation générale. Nous espérons que ces suggestions susciteront un débat plus large qui débouchera à son tour sur un consensus universel.

Les chiffres cités visent à se situer entre l'usage courant et celui qui serait souhaitable. Dans certains cas, la norme technique suggérée correspond à la technologie de pointe actuelle. L'expérience enseigne en effet que certaines technologies autrefois d'avant-garde sont devenues des normes pour les branches d'activité concernées.

1. Textes et images fixes

Les copies numériques seront normalement destinées à en faciliter la consultation. Des copies de sécurité ou de préservation de documents menacés seront parfois effectuées aussi conformément à des normes de qualité plus strictes. Par ailleurs, un groupe résiduel de documents sera toujours jugé impropre à être sauvegardé par les méthodes numériques et ne sera jamais numérisé que pour consultation. Les raisons de cette exception seront en général d'ordre culturel et historique plutôt que technique.

Le sous-comité a proposé des normes qu'il considère comme minimales s'agissant des copies pour "usage intermédiaire". Toutefois, lorsque les conservateurs sont pressés par les circonstances d'utiliser la numérisation comme un moyen de préserver des documents en péril, la saisie des images doit être effectuée de manière pleinement conforme à la norme fac-similé, avec le concours de spécialistes de la conservation et de techniciens capables de juger de la norme technique de saisie qui convient, celle-ci étant souvent beaucoup plus élevée que la norme minimale mentionnée ici.

Les principaux paramètres de la qualité des copies numérisées de livres, manuscrits et autres documents sur papier sont la résolution de l'image et le nombre de niveaux de gris ou de couleurs pour chaque pixel. Les chiffres donnés ci-dessous désignent la valeur minimale de chaque paramètre pour chaque catégorie de documents. Certains documents peuvent exiger des valeurs de résolution et un nombre de niveaux de gris/de couleurs supérieur. Ce sera le cas des textes comportant de très petits caractères ou des éléments d'une grande finesse. Les chiffres cités concernent les copies pour usage intermédiaire. Les reproductions faites aux normes fac-similé pour servir de copies de sécurité ou de préservation exigent des valeurs supérieures.

Les documents plats peuvent être saisis au moyen de scanneurs à plat. Les autres, de même que les livres anciens dont la reliure ne permet pas l'ouverture complète, devraient l'être au moyen d'un appareil de prise de vues numérique.

(a) Textes modernes

(i) Imprimés, documents dactylographiés, etc.
Paramètres de saisie200 ppp, mode trait (1 bit par pixel)
CompressionCCITT G IV
Format de fichierTIFF 6.0

(ii) Documents comportant des planches photographiques en noir et blanc
Paramètres de saisie100 ppp, niveaux de gris, 8 bits
Compressioncompression sans perte JPEG
Format de fichierTIFF 6.0

(b) Manuscrits et imprimés très anciens

(i) Documents monochromes
Paramètres de saisie100 ppp, niveaux de gris, 4 bits
Compressioncompression sans perte JPEG
Format de fichierTIFF 6.0

(ii) Documents en couleurs
Paramètres de saisie100 ppp, 24 bits/pixel
Compressioncompression sans perte JPEG
compression avec perte JPEG pour les images ne posant pas de problème d'interprétation
Format de fichierTIFF 6.0

La norme de fait Photo-CD est également utilisable.

(c) Vues photographiques fixes

La saisie se fera à 8 bits/pixel pour les documents monochromes et à 24 bits/pixel pour les documents en couleurs.

(i) Documents opaques
Paramètres de saisie100 ppp
Compressioncompression sans perte JPEG
compression avec perte JPEG pour les images ne posant pas de problème d'interprétation
Format de fichierTIFF 6.0

(ii) Documents transparents
Paramètres de saisie
8 x 10 pouces, 35 mm et microfilms
200 à 2.000 ppp (selon le facteur de réduction)
Compressioncompression sans perte JPEG
compression avec perte JPEG pour les images ne posant pas de problème d'interprétation
Format de fichierTIFF 6.0

Les microfilms ne comportant pas d'informations en plusieurs niveaux de gris peuvent être classés dans la catégorie (i) (a) Textes modernes.

La norme de fait Photo-CD est également utilisable.

(d) Cartes

La saisie se fera à 8 bits/pixel pour les documents monochromes et à 24 bits/pixel pour les documents en couleurs.
Paramètres de saisie100 ppp
Compressioncompression sans perte JPEG
Format de fichierTIFF 6.0

Il convient de photographier les cartes de format supérieur à A3 : c'est la photographie obtenue qui sera ensuite numérisée.

Le sous-comité de la technologie a examiné les avantages qu'il y avait à saisir les documents de grandes dimensions au moyen d'un appareil de prise de vues numérique, plutôt que de les photographier pour procéder ensuite à la numérisation. On s'est inquiété de la résolution limitée des appareils numériques existants, qu'il s'agisse du nombre de lignes ou de pixels par ligne qu'ils admettent. Il a été reconnu que les tout derniers systèmes de production de longs métrages faisaient appel à des appareils numériques de 3.000 lignes de résolution verticale et 2.500 pixels de résolution horizontale. Toutefois, ces systèmes n'étaient pas fabriqués sous la forme qui convenait pour numériser les documents sur papier de grandes dimensions. La résolution des caméras à CCD est principalement limitée par la taille de leurs puces électroniques. Des puces plus grosses permettent en théorie une plus haute résolution. Il est également possible de saisir les grands documents en plusieurs sections que l'on fera raccorder par le logiciel au moment de la visualisation.

Il convient chaque fois que possible de saisir les documents conformément à une norme élevée et d'effectuer ensuite, selon les besoins, des copies de moindre qualité à partir de cette première reproduction.

Les observations faites ci-dessus énoncent ce qu'il est réaliste de tenir pour possible dans la situation actuelle. La norme idéale peut être inapplicable aujourd'hui mais doit être gardée à l'esprit en tant qu'objectif à long terme. Un document en bon état que la technologie ne permet pas encore de saisir selon la norme idéale ne devrait pas être numérisé mais laissé en attente jusqu'à ce que le perfectionnement des techniques rende possible cette saisie idéale. Si, toutefois, le document considéré est en mauvais état ou fait l'objet de fréquentes demandes de consultation, il est alors recommandé de le numériser selon la meilleure norme existante possible. Pour surmonter les limites liées aux capacités du matériel de numérisation existant, il peut être souhaitable d'envisager d'effectuer des reproductions photographiques de haute qualité. On se souviendra cependant que les photographies sont elles-mêmes sujettes à dégradation.

2. Enregistrements sonores et images en mouvement

(a) Enregistrements sonores

En général, les normes techniques citées correspondent à la norme d'usage intermédiaire. Elles conviennent pour les transmissions faites à la norme d'interconnexion AES/EBU.

(i) Documents très anciens (cylindres, disques 78 tours)
norme d'échantillonnagebits/seconde octets par heure
48 kHz/20 bits
deux canaux
1920,0 kbits/s 864,0 Mo/h

L'utilisation d'un lecteur stéréo et la numérisation séparée de chaque sortie lors de la copie de documents enregistrés à l'origine sur des supports à sillons permet d'enregistrer indépendamment le signal de chaque sillon alors même que les deux sorties sont théoriquement identiques. Ce peut être utile en cas d'utilisation de logiciels d'élimination des bruits parasites dus aux rayures des sillons et aux manipulations lors de lecture de la copie numérique.

(ii) Documents analogiques modernes (disques microsillons, bandes)
norme d'échantillonnagebits/seconde octets par heure
48 kHz/20 bits
stéréo
1920,0 kbits/s864,0 Mo/h

(iii) Documents numériques

Stockage à la même norme que l'original.

La norme d'échantillonnage des CD du commerce - 44,1 kHz/16 bits par canal - peut servir de norme de copie pour la consultation de base et la diffusion.

En cas de consultation sur réseaux et d'applications multimédia, la réduction maximale admissible des données est celle définie par la norme ISO/MPEG-1 (audio) Couche III pour un débit de 64 kbits/s par canal. Seules les copies destinées à la consultation en mode balayage ou aux catalogues devraient être numérisées conformément à une norme moins stricte.

(b) Vidéogrammes analogiques

En général, les normes techniques citées correspondent à la norme d'usage intermédiaire.

Il existe deux méthodes de stockage et de diffusion des signaux vidéo couleur. Le signal vidéo reçu sur ondes hertziennes ou par câble (NTSC ou PAL) ou visionné à partir d'une bande lue à domicile (VHS, BetaMax etc.) est un signal composite codé de manière à porter à la fois l'information couleur et l'information luminance.

Le sous-comité recommande l'utilisation d'un format en composantes consistant à stocker chaque fois que possible séparément un signal "luminance" (équivalant à une image monochrome) et deux signaux "différence de couleur" de moins bonne qualité. Ce format est plus gourmand en espace de mémoire mais présente des avantages lors de la copie ou de la conversion des signaux. Les normes citées se fondent sur la Recommandation 601 du CCIR visant la vidéo numérique en composite.

La norme 601 du CCIR prévoit deux longueurs de mot pour le stockage : 8 bits ou 10 bits. Les premiers magnétoscopes numériques (D1 à D3) utilisaient des mots de 8 bits mais la tendance est à l'utilisation de mots de 10 bits. Les tout derniers magnétoscopes numériques permettent le stockage par mots de 10 bits. On a retenu ici la norme la plus élevée dans le souci d'accroître la fidélité des images stockées.
Norme d'échantillonnage Bits par secondeOctets par heure
Luminance (Y)13,50 MHz/10 bits 135 Mbits/s60,75 Go/h
Différence de couleur (U)6,75 MHz/10 bits 67,5 Mbits/s30,38 Go/h
Signaux (V)6,75 MHz/10 bits 67,5 Mbits/s30,38 Go/h
Totaux270,0 Mbits/s 121,50 Go/h

En pratique, le support le plus couramment utilisé aujourd'hui pour la consultation et la diffusion est la bande VHS. Sur le plan de la qualité, les bandes VHS sont plus en-deçà de la norme vidéo définie ci-dessus que les CD ne le sont de la norme audio qui précède. Le nouveau format numérique qui est proposé pour les bandes du type vidéo domestique pourrait garantir une meilleure qualité des copies de consultation.

En cas de consultation sur réseaux et d'applications multimédia, la réduction maximale admissible des données est celle définie par la norme MPEG-2 (Vidéo) pour un débit de 2 Mbits/s. Seules les copies destinées à la consultation en mode balayage ou aux catalogues devraient être numérisées selon une norme moins stricte.

(c) Vidéogrammes numériques

Stockage à la même norme que l'original.

(d) Films

La norme minime admissible pour réaliser des copies de consultation des films 35 mm serait une norme de la télévision à haute définition (TVHD). Toutefois, à l'époque de la rédaction du présent document, le domaine de l'enregistrement TVHD ne s'est pas encore stabilisé. Outre que le format préconisé en Amérique du Nord et au Japon (1.125 lignes, 60 trames par seconde) diffère de celui prôné en Europe (1.250 lignes, 50 trames par seconde), un certain nombre d'autres questions relatives aux formats d'enregistrement restent à régler.

Les deux formats TVHD de base permettent en principe l'un comme l'autre de réaliser des copies de qualité "Consultation" satisfaisantes. Tous deux sont utilisés pour tourner et produire des vidéogrammes promis à la télédiffusion ou au transfert sur des films destinés au public. Cependant, leur application présente souvent un caractère légèrement expérimental et fait appel à une gamme de matériels potentiellement incompatibles. Tant que les incertitudes entourant ces caractéristiques techniques n'auront pas été levées, le Sous-Comité demeurera dans l'impossibilité de formuler la moindre observation valable.

L'application d'une norme d'usage intermédiaire - propre à satisfaire les besoins de 99 % des usagers - à la copie des films 35 mm exigerait une capacité de stockage excédant en pratique les possibilités économiques actuelles. Certains systèmes spécialisés de restauration et de traitement dont les performances qualitatives dépassent celles que demanderaient les films 35 mm sont déjà utilisés. Cependant, ils ne permettent de travailler que sur de courtes sections. Chaque section achevée doit être recopiée sur un film car leur mémoire est insuffisante pour contenir en entier un long métrage de 90 minutes.


Up

ANNEXE B

OBSOLESCENCE DES FORMATS DES ENREGISTREMENTS
LISIBLES PAR MACHINE

L'obsolescence des formats des enregistrements lisibles par machine et les problèmes qu'elle pose en particulier pour les collections de vidéogrammes ont été examinés.

Pour qu'un format d'enregistrement soit lisible par machine, il faut, par définition, que son support et la machine nécessaire pour accéder à ce qu'il contient soient en bon état. Or, par l'une de ces bizarreries propres à la technique, en raison de leur plus grande complexité, les formats les plus récents sont souvent plus menacés par l'obsolescence que les formats anciens. Construire par exemple un phonographe pour lire les cylindres d'Edison est à la portée de n'importe quel atelier relativement bien équipé. Construire des machines pour lire les formats des enregistrements modernes est une tâche beaucoup plus ardue.

Les milieux de la vidéo s'attaquent actuellement aux problèmes posés par le premier format des enregistrements commerciaux - sur bandes Ampex quadruplex de 2 pouces. La situation de ces enregistrements apparus vers la fin des années 50 est en passe de devenir critique. De nombreuses bandes présentent des signes de détérioration ; les machines à utiliser pour les recopier sont vétustes et les pièces de rechange correspondantes ne sont plus fabriquées ; les opérateurs expérimentés approchent de l'âge de la retraite ou l'ont déjà atteint ; la quantité de bandes à inspecter et à recopier est énorme - de l'ordre de plusieurs millions d'heures d'enregistrements ; la documentation relative à beaucoup de ces bandes est insuffisante pour permettre de sélectionner sans visionnage préalable celles qu'il faut recopier. Afin de sauvegarder le contenu de ces bandes, il faut pourtant en effectuer des copies. Beaucoup de services de télévision et d'archives en ont entamé la reproduction numérique mais c'est là entreprendre une véritable course contre la montre.

Une seconde crise se profile à l'horizon en ce qui concerne les formats de bande qui ont suivi les formats de 2 pouces - à savoir les formats de 1 pouce. Adoptés vers la fin des années 70, ils ont été utilisés par les producteurs jusque vers le début des années 90.

Au moins sept autres formats d'enregistrement analogique ont été ou sont largement utilisés par les cadreurs amateurs et professionnels. A l'échelle mondiale, le problème est multiplié par la disparité des normes vidéo utilisées dans les différentes régions du globe. Les services d'archives et bibliothèques peuvent se voir offrir des documents utilisant n'importe lequel de ces formats. Seuls les services d'archives vidéo les plus vastes et les mieux équipés sont a priori à même de traiter toute cette gamme de formats et normes.

Depuis l'introduction du premier format vidéo numérique (D1) vers le milieu des années 80, au moins quatre autres ont été lancés. Aucun n'occupe une position dominante sur le marché. Le format D1 lui-même est aujourd'hui pratiquement obsolète.

Pour résoudre ce problème, il faut des techniciens qui sachent manipuler des documents de différents formats. Il faut aussi que les institutions possèdent des spécimens de machines obsolètes en état de marche - impératif qui rend la présence de techniciens spécialisés et hautement qualifiés d'autant plus nécessaire. A l'heure actuelle, il n'existe nulle part au monde de formation s'adressant aux techniciens des services d'archives. Quelques établissements seraient théoriquement à même d'en offrir mais il faut trouver les moyens financiers leur permettant d'organiser et d'administrer les cours qui conviendraient.

La formation des techniciens n'est pas une question d'ordre purement technique. La technologie moderne offre de multiples moyens de modifier les documents lors de leur reproduction. Les aspects éthiques de la copie d'archives doivent donc être enseignés, outre ses aspects techniques.

Les services d'archives et bibliothèques d'enregistrements sonores et d'images en mouvement ont besoin d'un format de stockage qui ne soit pas dicté exclusivement par les impératifs des entreprises de radiodiffusion et télévision, des éditeurs ou des fabricants. Ce format devra admettre des documents de plusieurs types de sorte que, par exemple, le son numérisé d'un disque microsillon puisse être stocké avec l'image de la photographie ornant sa pochette et le texte qui l'accompagne. Il est préférable d'adopter un système de stockage qui ne restreigne pas le flux de données numériques - autrement dit une mémoire à structure non imposée. Or la plupart des systèmes commerciaux fabriqués en série qui existent actuellement exigent que l'information soit mise sous une forme spécifique préalablement à l'enregistrement.

Un certain nombre de constructeurs proposent maintenant des systèmes de stockage entièrement automatisés qui s'autovérifient et s'autorenouvellent. La capacité qu'ils ont de recopier et de vérifier des supports sans intervention ou surveillance humaine constante permet de transférer des collections dans de nouveaux systèmes chaque fois que le besoin s'en fait sentir sans encourir les très importants coûts de main-d'oeuvre indissociables du transfert de supports analogiques ou de supports numériques rangés sur des rayonnages.

Ce n'est pas là de la science-fiction. Les systèmes de ce type commencent d'être installés dans certains services d'archives et bibliothèques d'enregistrements sonores. Ils sont également utilisés dans un certain nombre d'autres lieux, tels que les établissements bancaires et de recherche scientifique, qui ont besoin de stocker d'énormes quantités d'information numérique. Ils seront également à la base de nouveaux services aux consommateurs tels que la "vidéo sur demande".
Up

ANNEXE C

LISTE DES PARTICIPANTS

Membres du Sous-Comité de la technologie
Abdelaziz ABID
Programme général d'information (PGI)
UNESCO
1, rue Miollis
75015 Paris
France

Tél : +33 (1) 4568 4496
Fax : +33 (1) 4449 0058
Courrier électronique : a.abid@unesco.org
Michael ALEXANDER
The British Library
Computing and Telecomms
Boston Spa
Wetherby
West Yorkshire
LS23 7BQ
Royaume-Uni

Tél : +44 (1937) 546883
Fax : +33 (1937) 546872
Courrier électronique : michael.alexanderbl.uk
Julian BESCOS
Codirecteur du Projet Archivo de Indias
Codirecteur, Société "Archivos y Bibliotecas", créée par IBM Espagne et El Corte Ingles
Apartado Correos 179
28080 Madrid
Espagne

Tél : +34 (1) 397 9206
Fax : +34 (1) 735 1440
George BOSTON
14 Dulverton Drive
Furzton
Milton Keynes
MK4 1DE
Royaume-Uni

Rapporteur
Tél : +44 (1908) 502610
Fax : +44 (1908) 502520
Courrier électronique : gbostongn.apc.org
Dietrich SCHÜLLER
Director Phonogrammarchiv
Österreucguscgeb Akademie der Wissenschaften
Liebiggasse 5
A-1010 Vienne
Autriche

Président
Tél : +43 (1) 40103 2734
Fax : +43 (1) 403 0465
Courrier électronique : pharchivkfs.oeaw.ac.at

Ont également pris part aux débats ou fourni à diverses occasions leurs avis et observations :
Bill BULFORD
BBC Television
Television Centre
Wood Lane
Londres W12 7RJ
Royaume-Uni

Tél : +44 (181) 576 1566
Fax : +44 (181) 576 1639
Michael CROLL
BBC Research Department
Kingswood Warren
Tadworth
Surrey
Royaume-Uni

Tél : +44 (1737) 836612
Fax : +44 (1737) 836665
Brian JENKINSON
National Film and Television Archive
John Paul Getty III Conservation Centre
Kingshill Way
Berkhamsted
Hertfordshire
Royaume-Uni

Tél : +44 (1442) 876301
Fax : +44 (1442) 862085
Jacques KLOSSA
Directeur général TRIBUN-VTCOM
(France TELECOM)
40, rue Gabriel Péri
92240 Malakoff
France

Tél : +33 (1) 4612 6971
Fax : +33 (1) 4612 6980
Franz LECHLEITNER
Phonogrammarchiv
Liebiggasse 5
A-1010 Vienne
Autriche

Tél : +43 (1) 40103 2740
Fax : +43 (1) 4030465
Courrier électronique : pharchivkfs.oeaw.ac.at
John NUNN
BBC Radio
Room 4102
Broadcasting House
Portland Place
Londres W1A 1AA
Royaume-Uni

Tél : +44 (171) 765 3522
Fax : +44 (171) 765 3822

Un concours a également été reçu de :
Harald GARDOS
Secrétaire général
Commission autrichienne pour l'UNESCO
Mentergasse 11
A-1070 Vienne
Autriche

Tél : +43 (1) 523 64 21
ou +43 (1) 526 36 80
Fax : +43 (1) 526 13 01



Up


Retour Sommaire Accueil Mémoire Découvrir Participer Suite


Envoyez-nous vos commentaires!
14 Novembre 1996