Les membres du sous-comité de la technologie tiennent à
exprimer leur gratitude aux personnes qui les ont aidés
de leurs conseils et observations concernant ce document.
Le sous-comité étant toutefois l'unique auteur des
conclusions finales et du dernier libellé des recommandations,
les éventuelles erreurs contenues dans le présent
document ne doivent en aucun cas être imputées à
nos conseillers.
Il convient de noter par ailleurs que les recommandations sont
valables pour la date actuelle.
Elles portent essentiellement sur la numérisation et les
possibilités qu'elle offre d'améliorer l'accès
aux documents de tous ordres, y compris les manuscrits et autres
textes, les enregistrements sonores et les images, ainsi que leur
préservation. Leur objet est d'encourager l'étude
des avantages de la numérisation tout en mettant en évidence
qu'il ne s'agit pas d'une panacée permettant de résoudre
tous les problèmes de conservation des fonds documentaires.
En particulier, le sous-comité de la technologie tient
à indiquer clairement que les méthodes traditionnelles
de conservation utilisées pour maintenir les documents
en état de servir ne deviendront pas caduques du fait du
lancement d'un programme de numérisation. La numérisation
complète d'une collection prendra souvent des années ;
aussi est-il indispensable de poursuivre les programmes de préservation
des documents originaux. Dans la plupart des cas, la copie numérisée
ne se substituera pas à l'original mais constituera un
exemplaire de consultation acceptable pour la majorité
des utilisateurs et contribuant en conséquence à
réduire les facteurs d'usure de l'original.
Les copies de consultation sous la forme de microfilms et de photographies
demeureront sans doute également nécessaires dans
les cas où l'état actuel de la technologie numérique
ne permettra pas d'effectuer des reproductions d'une qualité
suffisante.
La technologie évolue cependant et les normes de numérisation
ne cessent de s'améliorer. Ces recommandations doivent
donc être considérées comme un projet de texte
demandant à être régulièrement revu
et mis à jour.
Divers préfixes servant aux scientifiques à exprimer
la grandeur sont utilisés dans le présent document.
On en indique brièvement ci-dessous la hiérarchie
à l'intention des personnes auxquelles ces termes ne seraient
pas familiers. Chaque préfixe désigne une grandeur
mille fois supérieure à celle qui précède.
Ces préfixes sont utilisés en combinaison avec les
mots bit - chiffre binaire - ou octet (o) - groupe
de 8 chiffres binaires.
1. Résumé
Le sous-comité de la technologie du Comité consultatif
international du programme Mémoire du monde :
Ayant examiné les avantages présentés par
les différentes technologies actuellement disponibles,
Conscient de l'accroissement de la demande de consultation des
documents,
Mais conscient également des risques d'endommagement que
leur fait courir une utilisation excessive,
Constatant par ailleurs la nécessité de réaliser
des copies de préservation de nombreux documents en péril,
Tenant compte du fait que de nombreux supports analogiques de
données ont une durée de vie limitée et qu'il
faut recopier l'information qu'ils contiennent afin de la sauvegarder
en prévision de l'avenir lointain,
Mais considérant également que la copie de type
analogique se traduit inévitablement par une perte de qualité,
Et tenant compte de ce qu'à l'heure actuelle les documents
ne se prêtent pas tous à la reproduction sur un nouveau
support,
Suggère qu'un programme de numérisation des documents
représente la meilleure solution de compromis permettant
de répondre aux demandes conflictuelles d'élargissement
de l'accès aux collections et d'amélioration de
la protection des documents.
Le sous-comité de la technologie recommande en conséquence
que les conservateurs de toutes les collections examinent de près
les avantages qui pourraient résulter, pour celles dont
ils ont la garde, de la création de copies numériques
des documents.
2. Remarques liminaires
(a) Limites des recommandations
Les exigences techniques que devrait satisfaire le catalogue d'une
collection numérisée ne font pas encore l'objet
d'un accord. Il est évident que ce type de catalogues peut
offrir des avantages dont les catalogues traditionnels sont dépourvus,
en particulier en ce qui concerne les images et enregistrements
sonores. On peut, par exemple, y intégrer un système
actif de pointeurs renvoyant d'un document à des documents
connexes. Un débat des documentalistes aboutissant à
la définition des caractéristiques requises des
catalogues permettrait au sous-comité de la technologie
d'inclure celles-ci dans ses recommandations techniques.
(b) Exceptions à la numérisation
Le sous-comité de la technologie reconnaît qu'il
n'est pas souhaitable, à l'heure actuelle, de numériser
certaines catégories de documents. Les raisons en sont
variables. Ainsi, le stockage numérique des films cinématographiques
demande trop d'espace de mémoire pour qu'il soit possible
de l'effectuer de manière économique en l'état
actuel de la technologie ; par ailleurs, les cartes et plans
de grandes dimensions n'entrent pas dans les scanneurs existants.
En outre, il existe des documents dont la valeur transcende celle
de l'information qu'ils contiennent. L'art dont témoignent
les manuscrits enluminés et l'importance historique de
documents tels que la Grande Charte d'Angleterre ou la Déclaration
d'indépendance des Etats-Unis les fait sortir de la catégorie
des simples supports d'information. De même, davantage encore
de documents modernes - photographies d'art, films, enregistrements
sonores -comptent parmi les pièces de valeur de nombreuses
collections. La réalisation d'une copie numérique
de ces documents ne rendra pas justice à tous les éléments
de leur aspect et de leur nature mais réduira toutefois
les facteurs d'usure auxquels les soumet une utilisation excessive.
(c) Urgence
Il faut de toute urgence créer un nouveau système
de stockage de certains types d'enregistrements sonores et images
en mouvement. Leurs supports sont en effet chaque jour plus nombreux
à se dégrader au-delà de toute possibilité
de restauration. C'est un nouvel "incendie de la Bibliothèque
d'Alexandrie" qui se déroule lentement sous nos yeux.
Les livres, les manuscrits et les estampes se détériorent
également. La question est maintenant de savoir non plus
"si" ces supports d'information vont disparaître
mais "quand" cela va se produire. Certains supports
sont appelés à survivre pendant des milliers d'années.
Beaucoup ne durent que quelques milliers de jours. Pour sauvegarder
l'information qu'ils contiennent, il faut la recopier.
(d) Préservation des documents originaux
Le sous-comité souligne que la mise en place d'un vaste
programme de numérisation ne doit pas être considéré
comme le prélude au lancement d'un programme d'élimination
des supports originaux. Dans le cas de nombreuses collections,
la numérisation servira avant tout à améliorer
l'accès aux documents. Les copies numériques faciliteront
la sauvegarde du document original en réduisant le nombre
des demandes de consultation le concernant et donc des facteurs
d'usure auxquels il sera soumis.
A l'heure actuelle, les documents ne se prêtent pas tous
à la réalisation d'une copie numérique d'une
qualité suffisante. De légères distorsions
et pertes risquent de se produire. Il faudra donc pouvoir disposer
des originaux à la date à venir où les progrès
de la technologie permettront d'apporter les améliorations
nécessaires à la qualité de la reproduction
et de la numérisation.
Sans doute existe-t-il des documents, en particulier dans les
domaines du son et des images en mouvement, dont il est rationnel
d'éliminer les originaux après numérisation
car leurs supports sont trop abîmés pour qu'il soit
possible de les conserver. Cependant ce n'est pas là la
règle normale.
(e) Recommandation concernant la technologie de la numérisation
Le sous-comité n'est pas en mesure de formuler une unique
recommandation catégorique sur le type de matériel
de numérisation ou le support de mémoire à
utiliser. Cette question doit être étudiée
par les conservateurs des collections au moment de l'évaluation
des besoins de chaque institution. Certains des points à
examiner sont indiqués ci-dessous, de même que certaines
normes techniques minimales auxquelles le matériel et le
procédé de reproduction doivent satisfaire. Les
membres du sous-comité de la technologie sont prêts
à donner leur avis sur des questions précises et
à recommander des spécialistes susceptibles de jouer
le rôle de conseillers pour les projets qui requièrent
une assistance plus poussée.
L'état des techniques ne cesse d'évoluer et le sous-comité
de la technologie a l'intention d'en poursuivre l'étude.
3. La numérisation
(a) Numériser : pourquoi faire ?
La demande de consultation des documents s'accroît, augmentant
à son tour le risque qu'ils soient endommagés aussi
bien graduellement que de manière brutale et catastrophique.
Même si de nombreux types de dégâts sont réparables,
les dépenses en jeu peuvent être énormes.
Et lorsque les dommages causés sont graves, en particulier
s'agissant des supports du son et des images en mouvement, le
document se trouve détruit de fait.
Numériser un document permet de satisfaire les demandes
de consultation de la majorité des usagers en mettant à
leur disposition la copie numérisée. Beaucoup d'utilisateurs
souhaitent en effet étudier le contenu des documents et
n'ont pas besoin d'en examiner le support initial.
En outre, dans le cas de nombreux documents, il est également
possible d'effectuer une copie numérisée de meilleure
qualité qui peut constituer une copie de sauvegarde de
l'original.
(b) Avantages de la numérisation
Le sous-comité de la technologie estime que les principaux
avantages potentiels de la numérisation sont les suivants :
(i) Reproduction - il est possible de réaliser des copies
de l'information déjà numérisée en
utilisant soit le même format de stockage soit un autre
format numérique, sans perte de qualité.
(ii) Automatisation - sont automatisés non seulement la
restitution des éléments demandés par les
chercheurs, grâce à l'utilisation de systèmes
de stockage robotisés, mais aussi le processus de reproduction.
Le document étant représenté par une chaîne
de chiffres binaires, il est possible d'automatiser la copie,
voire de se passer d'en vérifier la fidélité
au moyen d'une intervention humaine.
(iii) Contrôle et réparation automatiques - dès
lors que la reproduction de l'information numérique peut
être automatisée, il doit devenir possible de contrôler
automatiquement l'état de la collection, et, si des erreurs
excessives sont décelées sur un support numérique,
de réaliser une copie corrigée du document sans
intervention humaine.
(iv) Recherche - la numérisation offre la possibilité
d'effectuer des recherches dans les catalogues aussi bien locaux
que lointains et de créer un tissu (web) de liens ou de
pointeurs renvoyant du document consulté par l'utilisateur
à des documents connexes de la même collection ou
d'autres. Des recherches de texte intégral peuvent en outre
être effectuées. Des techniques de recherche analogues
sont actuellement élaborées pour les documents sonores
et les images.
(v) Accessibilité - elle tient à la capacité
d'envoyer un signal numérique sur les réseaux de
télécommunications sans perte de qualité.
L'utilisation de systèmes de stockage robotisés
de grande capacité rend la collection numérisée
accessible 24 heures sur 24 avec un minimum de personnel.
(vi) Rapidité de la copie - dans le domaine numérique,
il est possible de recopier fidèlement ou de transférer
des données à une vitesse très élevée.
Une copie sur support papier peut être fournie rapidement
au chercheur. Le futur transfert des collections sur de nouveaux
supports sera beaucoup plus rapide que le passage initial à
la numérisation.
(vii) Qualité - elle tient à la possibilité
de numériser un document avec une très forte ou
une faible résolution, selon les besoins. Il est également
très facile de réaliser des copies de qualité
inférieure à partir de la copie de haute qualité
chaque fois que nécessaire.
(viii) Espace nécessaire - la haute densité du stockage
de l'information sur les supports numériques peut se traduire
par une réduction majeure de l'espace de rayonnage nécessaire.
D'où, également, une réduction de l'espace
nécessitant une régulation climatique conforme aux
normes archivistiques et, en conséquence, un abaissement
des frais de fonctionnement.
(ix) Futurs transferts de la collection - si une collection est
copiée sur un support analogique, le coût de ses
futurs transferts sera identique (sous réserve de l'inflation)
à celui de cette première reproduction. Si elle
est copiée sur un support numérique, on pourra,
lors des futurs transferts, tirer parti des possibilités
de recopie automatisée inhérentes au numérique
(voir les points 3 (b) (i) et (ii) ci-dessus).
Le transfert de collections de données numériques
n'est pas un phénomène nouveau. Les milieux bancaires,
par exemple, ont transféré plusieurs fois avec succès
leurs banques de données. Leur expérience peut offrir
des enseignements utiles pour le transfert de l'information textuelle,
visuelle et sonore.
(c) Inconvénients de la numérisation
Le principal inconvénient perçu par de nombreuses
personnes est son coût. Les idées à ce sujet
peuvent être résumées sous quatre rubriques :
(i) Investissement initial - le matériel nécessaire
pour effectuer la numérisation peut être coûteux
et demande souvent à être utilisé par des
opérateurs qualifiés pour donner les meilleurs résultats.
(ii) Contraintes de rangement - on croit souvent que les supports
utilisés pour stocker l'information numérisée
devront être conservés dans un environnement très
propre et très stable sur le plan climatique, ce qui accroîtra
la consommation d'énergie imputable à la collection.
L'aménagement de cet espace de rangement à l'atmosphère
stabilisée exigerait en outre un investissement initial.
(iii) Frais de fonctionnement - on craint qu'une collection numérisée
ne doive elle aussi être fréquemment recopiée,
avec les coûts de main-d'oeuvre, d'énergie et d'achat
de nouveaux supports que cela implique et que la survie de l'information
numérique ne soit pas garantie au-delà de deux à
trois ans si elle est stockée sur bande magnétique
et de trois à cinq ans si elle est conservée sur
disque optique.
(iv) Coûts de préparation - un document doit être
préparé pour la saisie numérique. Outre l'éventuelle
préparation physique requise, le contenu initial doit en
être classé et indexé et les références
textuelles introduites dans la base de données par du personnel
spécialisé, opérations qui peuvent être
coûteuses. On pense que la copie de l'information des supports
existants sur de nouveaux supports implique d'importantes contraintes
de main-d'oeuvre.
Le sous-comité de la technologie a examiné ces points
et formulé les observations et suggestions suivantes :
(i) De petits services d'archives et de bibliothèques peuvent
éventuellement se grouper pour mettre en commun un ensemble
d'installations de numérisation. Après l'opération
majeure de saisie initiale, la numérisation peut être
un processus relativement intermittent dans les petites institutions.
Les grandes collections dotées d'un programme intensif
d'accroissements devront nécessairement posséder
leur propre matériel.
Les coûts d'équipement à consacrer à
un programme de numérisation doivent également être
comparés aux économies qui pourront être faites
sur les coûts de préservation/restauration. Ces économies
seront rendues possibles par la concentration des ressources affectées
à la préservation de la collection sur les documents
dont la valeur ne tient pas seulement à leur caractère
de supports d'information. Le stockage numérique est le
seul moyen de sauvegarder sans distorsion pendant des millénaires
l'information contenue sur nombre de supports en voie de dégradation.
(ii) Les disques optiques et les bandes magnétiques qui
sont utilisés dans les systèmes de numérisation
actuellement disponibles n'exigent pas une propreté ou
une régulation climatique extrêmement rigoureuses.
A supposer qu'il faille aménager une zone de rangement
conformément à des normes très strictes de
ces deux points de vue, elle sera de taille très réduite
comparée aux espaces de rayonnages traditionnels.
(iii) Les premiers formats de stockage sur bandes informatiques
étaient dépourvus des dispositifs perfectionnés
de protection contre les erreurs dont les formats modernes sont
dotés. En outre, les bandes ne se présentaient pas
sous la forme de cassettes ou cartouches et étaient donc
endommagées en cas de manipulations peu soigneuses. Les
banques et les autres institutions qui ont utilisé ces
premiers formats de bandes magnétiques recopiaient celles-ci
à des intervalles rapprochés pour éviter
les erreurs auxquelles les systèmes de correction simple
de l'époque ne pouvaient parer.
Beaucoup de professionnels de la télévision s'emploient
actuellement à recopier sur des supports numériques
leurs vieilles bandes vidéo datant de la fin des années 50.
Ils y sont poussés par l'obsolescence des machines et,
dans certains cas, par la dégradation des supports. L'instabilité
des particules magnétiques contenant l'information n'entre
pas en ligne de compte.
A l'issue d'amples recherches sur les aspects économiques
à long terme de la recopie de leurs collections, ces professionnels
sont parvenus à la conclusion que les formats de bandes
vidéo numériques modernes leur offraient le meilleur
moyen de préserver le contenu de leurs vidéogrammes.
Ces bandes et les systèmes de correction d'erreur qu'elles
comportent pourraient également servir au stockage d'autres
formes de documents incluant des textes, des images fixes et des
sons.
Des facteurs tels que la fréquence d'utilisation et le
milieu d'entreposage influent sur la durée de vie des bandes.
Les bandes souvent consultées ont une durée de vie
plus brève que la normale, mais il est probable que le
nombre en est relativement faible. Des duplicatas des articles
très demandés pourraient par ailleurs être
conservés.
Les disques optiques existent sous la forme de CD du commerce
depuis maintenant plus de dix ans. Le nombre des cas de perte
de l'information qui y était stockée est infime.
Les cas signalés s'expliquaient le plus souvent par le
caractère corrosif de l'encre utilisée pour imprimer
les étiquettes des disques, encre qui a altéré
les données numériques. Le problèmes a été
décelé et résolu rapidement.
L'emploi d'un système de stockage robotisé permet
de réduire fortement les coûts de vérification
des supports et de reproduction. Certains systèmes robotisés
sont déjà dotés d'une fonction de vérification
automatique qui décèle les erreurs sans intervention
humaine. La reproduction automatique sans intervention humaine
est également réalisable et n'entraîne pas
d'autres coûts que celui du nouveau support nécessaire
pour effectuer la copie.
(iv) Pour microfilmer des documents, il faut bien aussi les préparer
et les restaurer avant de les photographier. Dans bien des cas,
les documents à numériser ne demandent pas de remise
en état matérielle préalable. Leur "restauration"
peut souvent être effectuée plus efficacement et
à meilleur coût sous la forme électronique,
au moment de la consultation de l'information. Cela permettra
également de tirer parti des futures améliorations
des techniques "d'autopsie" documentaire qu'il pourrait
être impossible d'appliquer à des pièces ayant
subi une restauration matérielle. Des dégradations
telles que la perte des contrastes, les bavures d'encre, les colorations,
les taches, etc. survenues au cours de l'existence d'un document
font partie de son histoire. C'est pourquoi il est fortement recommandé
de le "restaurer" sous une forme numérique plutôt
que par des méthodes physiques dont l'effet sera permanent.
Les compétences requises des opérateurs appelés
à effectuer la numérisation se situent au même
niveau que celles exigées du personnel chargé du
microfilmage. Un certain recyclage sera nécessaire mais
l'élément coût de personnel ne devrait pas
varier sensiblement. En outre, il sera peut-être possible
d'automatiser partiellement la saisie.
(d) Facteurs de coût et de qualité en matière
de numérisation
La réalisation d'une copie d'un support analogique classique
sur un nouveau support
Sur certains types de support, cette dégradation peut passer
inaperçue en raison de la redondance intrinsèque
de l'information. C'est particulièrement vrai dans le cas
des textes imprimés qui ne deviennent illisibles que lorsque
les erreurs sont très importantes. Sur d'autres types de
support d'information, une dégradation même minime
entraîne une perte de qualité évidente.
La copie d'un support numérique sur un autre support numérique
permet d'automatiser à la fois les éléments
mécaniques de l'opération et sa surveillance. La
qualité technique de la copie numérique effectuée
à partir d'un original numérique est identique à
celle de l'original.
(e) Copies de consultation et de préservation
Au cours des débats du sous-comité de la technologie,
une divergence de vues fondamentale s'est fait jour entre les
deux groupes de travail chargés, respectivement, des textes
et images fixes et des enregistrements sonores et images en mouvement.
Pour le premier groupe, la numérisation est avant tout
un outil de consultation. Le second y recherche plutôt un
moyen de confectionner des fac-similés de haute qualité
dans un but de préservation. Ce fait n'enlève pas
leur valeur aux recommandations du sous-comité mais renforce
au contraire la nécessité d'un dialogue. Un même
système de reproduction numérique produisant des
copies d'une fidélité modulable permettra d'améliorer
à la fois l'accès aux documents et leur préservation.
Pour certaines collections, les supports de mémoire fabriqués
en grande série tels que les CD-ROM et les CD réinscriptibles
(CD-R), distribuables physiquement aux utilisateurs si c'est jugé
souhaitable, représenteront la meilleure solution. Les
CD-ROM et les CD-R offrent un moyen raisonnablement bon marché
d'aborder la numérisation ; par ailleurs, à
mesure que la taille de la collection numérisée
s'accroît, on peut mettre ces disques dans un chargeur automatique
pour accélérer le service aux usagers.
D'autres collections feront mieux d'opter pour la mémoire
robotisée de grande capacité téléconsultable
par l'intermédiaire de réseaux. Le choix de la solution
optimale variera d'une collection à l'autre. Dans certains
cas, il faudra recourir à la fois aux supports fabriqués
en série et à la mémoire robotisée.
(f) Limites de la numérisation
Comme indiqué ci-dessus, la numérisation présente
deux limites principales :
(i) certains types de documents et en particulier les images en
mouvement et les vastes collections de photographies fixes de
haute qualité exigent un espace de mémoire énorme.
La technologie du stockage numérique continue cependant
de s'améliorer et le coût unitaire du stockage est
en chute tandis que la capacité des systèmes de
stockage s'accroît ;
(ii) la définition des copies numériques réalisées
au moyen des technologies actuelles peut être insuffisante
pour garantir la haute fidélité que requièrent
certains types de documents.
(g) Dangers de la numérisation
Il ressort des observations faites ci-dessus que la numérisation
n'est pas considérée actuellement comme un outil
universel de préservation. La reproduction numérique
de nombreux documents favorisera néanmoins leur sauvegarde
en réduisant les pressions dont les originaux font l'objet.
La création d'une copie de consultation numérique
n'autorise pas à négliger ou à éliminer
le document original. Les organismes de financement des institutions
de conservation doivent être bien conscients que la numérisation
est, pour la majorité des documents, un moyen d'élargir
à davantage de personnes l'accès à l'information
(par l'établissement d'une copie de haute qualité)
sans accroître les risques d'endommagement de l'original
et les coûts élevés de restauration qu'ils
impliquent.
4. Normes
(a) Normes techniques
La reproduction numérique peut être réalisée
conformément à différentes normes de qualité.
Il faut donc, lors de l'examen de chaque document préalablement
à la numérisation, décider de la norme technique
optimale à lui appliquer spécifiquement.
S'agissant des documents stockables sous la forme d'images fixes,
l'examen de l'information à numériser permet de
distinguer différents niveaux d'exigence :
1. pour beaucoup de documents textuels, il suffit de s'en tenir
à une norme de stockage en mode trait (en deux tons) de
base - autrement dit de faire une photocopie numérique.
Cette norme serait valable pour de nombreux livres et documents
dactylographiés ;
2. pour numériser comme il convient les documents incluant
des images monochromes et des photographies fixes, il faut appliquer
une norme de stockage selon une échelle de gris - c'est-à-dire
faire l'équivalent d'une photographie en noir et blanc ;
3. les documents comportant des couleurs, tels que les manuscrits
enluminés et les cartes, ainsi que les pièces susceptibles
de demander une étude du type "autopsie" exigent
une numérisation "pleine couleur".
De par leur nature, les enregistrements sonores et les images
en mouvement doivent être stockés selon différents
niveaux de définition normalisés ; dans bien
des cas, ces niveaux de définition ont toutefois déjà
été fixés par des normes techniques internationales
reconnues.
(b) Normes d'utilisation
Les conservateurs des collections doivent décider de la
finalité de toute copie numérisée :
consultation de base - elle exige une copie consultable par tous,
le document original restant disponible pour examen par les seuls
spécialistes et chercheurs. Cette copie devra être
propre à satisfaire les besoins de 95 % des usagers ;
usage intermédiaire - certaines collections auront besoin
de copies afin, par exemple, de mieux protéger un document
important ou très demandé en limitant, y compris
pour les chercheurs et spécialistes, l'accès à
l'original. La copie pour usage intermédiaire devra être
propre à satisfaire les besoins de 99 % des usagers ;
fac-similé - s'il s'agit de remplacer un document très
endommagé, la norme à appliquer sera celle de la
préservation - c'est-à-dire de la réalisation
d'un fac-similé aussi proche que possible de l'original.
Celui-ci sera admis comme le duplicata du document original dont
il constituera une copie de sécurité ou de préservation.
Une norme "catalogue" ou "mode balayage" (browse)
sera peut-être également nécessaire. Il s'agirait
par exemple de permettre aux utilisateurs d'accéder à
des sons, des images ou des illustrations en se servant de copies
de basse qualité comme instruments de recherche.
(c) Reconnaissance optique de caractères
Le recours aux systèmes de reconnaissance optique de caractères
(ROC) plutôt qu'à la saisie d'images en mode trait
pour numériser les textes a été examiné.
Les systèmes de ROC présentent plusieurs avantages
potentiels dont les principaux sont qu'ils demandent moins d'espace
de mémoire numérique et permettent de consulter
les textes directement sans devoir passer par un catalogue de
mots clés. A l'heure actuelle, les logiciels de ROC sont
d'une fiabilité et d'une utilité réduites.
Les travaux sur ces systèmes se poursuivent et le développement
à l'échelle commerciale de modèles capables,
par exemple, de reconnaître dans des conditions limitées
l'écriture manuscrite et de la transformer en caractères
d'imprimerie est le signe d'un intérêt croissant
du marché pour de secteur. Si les systèmes de ROC
acquièrent une fiabilité suffisante, leur utilisation
générera une quatrième norme technique applicable
à la saisie des documents textuels.
(d) Compression des données et réduction des
données
La compression des données (sans perte d'information) est
acceptable lors de l'opération de saisie lorsque le manque
d'espace de mémoire la rend indispensable. C'est un processus
réversible : la décompression restitue le signal
dans son intégralité.
La réduction des données, en revanche, est irréversible.
Les inconvénients d'une copie numérique où
les données auront été réduites n'apparaîtront
peut-être que le jour encore indéterminé où
l'on essaiera de la manipuler dans certains buts spéciaux,
par exemple pour faire ressortir certaines couleurs facilitant
la détection d'un filigrane ou d'une inscription partiellement
effacée. La réduction des données n'est acceptable
que si elle n'entraîne aucune perte décelable d'information
cruciale susceptible d'être demandée par les utilisateurs.
Elle peut être un moyen puissant et indispensable de faciliter
la création de copies pour consultation et diffusion. Cependant,
elle est inacceptable dans toutes les opérations en rapport
avec la préservation.
5. Conclusion
Le sous-comité de la technologie recommande que tous les
conservateurs de collections envisagent la numérisation
des documents comme un moyen d'améliorer l'accès
à ceux dont ils ont la garde sans accroître simultanément
les risques de détérioration des collections. Ils
devraient aussi envisager d'y recourir, lorsque c'est nécessaire
et/ou possible, pour créer des copies de sauvegarde de
l'information.
Les avantages des programmes de numérisation à grande
échelle sont largement supérieurs à leurs
inconvénients. Le sous-comité de la technologie
garde à l'étude les catégories de documents
qu'il ne convient pas de numériser en raison des limites
du matériel et des procédés actuellement
disponibles ; de nouvelles recommandations seront faites
de temps à autre à ce sujet.
Kilo (K) 103
Mille
Méga (M) 106
Mille kilo ou un million
Giga (G) 109
Mille méga ou un milliard
Téra (T) 1012
Mille giga ou un billion
Péta (P) 1015
Mille téra
Exa (E) 1018
Mille péta
Up
- qu'il soit analogique ou numérique - est coûteuse.
Il faut faire appel à du personnel spécialement
formé qui puisse surveiller et régler les opérations
pour assurer que la qualité du transfert soit optimale.
La qualité technique de la copie analogique réalisée
à partir d'un original analogique est inférieure
à celle de l'original et se dégrade régulièrement
à chaque recopie.
Le sous-comité de la technologie a examiné longuement les normes techniques qui devraient être appliquées à la numérisation des documents. C'est là une question complexe en raison de la multiplicité des normes officielles et de fait actuellement en usage. Nous savons, en avançant les chiffres cités ci-dessous, que ceux-ci ne recueilleront pas l'approbation générale. Nous espérons que ces suggestions susciteront un débat plus large qui débouchera à son tour sur un consensus universel.
Les chiffres cités visent à se situer entre l'usage courant et celui qui serait souhaitable. Dans certains cas, la norme technique suggérée correspond à la technologie de pointe actuelle. L'expérience enseigne en effet que certaines technologies autrefois d'avant-garde sont devenues des normes pour les branches d'activité concernées.
1. Textes et images fixes
Les copies numériques seront normalement destinées à en faciliter la consultation. Des copies de sécurité ou de préservation de documents menacés seront parfois effectuées aussi conformément à des normes de qualité plus strictes. Par ailleurs, un groupe résiduel de documents sera toujours jugé impropre à être sauvegardé par les méthodes numériques et ne sera jamais numérisé que pour consultation. Les raisons de cette exception seront en général d'ordre culturel et historique plutôt que technique.
Le sous-comité a proposé des normes qu'il considère comme minimales s'agissant des copies pour "usage intermédiaire". Toutefois, lorsque les conservateurs sont pressés par les circonstances d'utiliser la numérisation comme un moyen de préserver des documents en péril, la saisie des images doit être effectuée de manière pleinement conforme à la norme fac-similé, avec le concours de spécialistes de la conservation et de techniciens capables de juger de la norme technique de saisie qui convient, celle-ci étant souvent beaucoup plus élevée que la norme minimale mentionnée ici.
Les principaux paramètres de la qualité des copies numérisées de livres, manuscrits et autres documents sur papier sont la résolution de l'image et le nombre de niveaux de gris ou de couleurs pour chaque pixel. Les chiffres donnés ci-dessous désignent la valeur minimale de chaque paramètre pour chaque catégorie de documents. Certains documents peuvent exiger des valeurs de résolution et un nombre de niveaux de gris/de couleurs supérieur. Ce sera le cas des textes comportant de très petits caractères ou des éléments d'une grande finesse. Les chiffres cités concernent les copies pour usage intermédiaire. Les reproductions faites aux normes fac-similé pour servir de copies de sécurité ou de préservation exigent des valeurs supérieures.
Les documents plats peuvent être saisis au moyen de scanneurs à plat. Les autres, de même que les livres anciens dont la reliure ne permet pas l'ouverture complète, devraient l'être au moyen d'un appareil de prise de vues numérique.
(a) Textes modernes
(i) Imprimés, documents dactylographiés, etc.
| Paramètres de saisie | 200 ppp, mode trait (1 bit par pixel) |
| Compression | CCITT G IV |
| Format de fichier | TIFF 6.0 |
(ii) Documents comportant des planches photographiques en noir et blanc
| Paramètres de saisie | 100 ppp, niveaux de gris, 8 bits |
| Compression | compression sans perte JPEG |
| Format de fichier | TIFF 6.0 |
(b) Manuscrits et imprimés très anciens
(i) Documents monochromes
| Paramètres de saisie | 100 ppp, niveaux de gris, 4 bits |
| Compression | compression sans perte JPEG |
| Format de fichier | TIFF 6.0 |
(ii) Documents en couleurs
| Paramètres de saisie | 100 ppp, 24 bits/pixel |
| Compression | compression sans perte JPEG compression avec perte JPEG pour les images ne posant pas de problème d'interprétation |
| Format de fichier | TIFF 6.0 |
La norme de fait Photo-CD est également utilisable.
(c) Vues photographiques fixes
La saisie se fera à 8 bits/pixel pour les documents monochromes et à 24 bits/pixel pour les documents en couleurs.
(i) Documents opaques
| Paramètres de saisie | 100 ppp |
| Compression | compression sans perte JPEG compression avec perte JPEG pour les images ne posant pas de problème d'interprétation |
| Format de fichier | TIFF 6.0 |
(ii) Documents transparents
| Paramètres de saisie 8 x 10 pouces, 35 mm et microfilms | 200 à 2.000 ppp (selon le facteur de réduction) |
| Compression | compression sans perte JPEG compression avec perte JPEG pour les images ne posant pas de problème d'interprétation |
| Format de fichier | TIFF 6.0 |
Les microfilms ne comportant pas d'informations en plusieurs niveaux de gris peuvent être classés dans la catégorie (i) (a) Textes modernes.
La norme de fait Photo-CD est également utilisable.
(d) Cartes
La saisie se fera à 8 bits/pixel pour les documents monochromes et à 24 bits/pixel pour les documents en couleurs.
| Paramètres de saisie | 100 ppp |
| Compression | compression sans perte JPEG |
| Format de fichier | TIFF 6.0 |
Il convient de photographier les cartes de format supérieur à A3 : c'est la photographie obtenue qui sera ensuite numérisée.
Le sous-comité de la technologie a examiné les avantages qu'il y avait à saisir les documents de grandes dimensions au moyen d'un appareil de prise de vues numérique, plutôt que de les photographier pour procéder ensuite à la numérisation. On s'est inquiété de la résolution limitée des appareils numériques existants, qu'il s'agisse du nombre de lignes ou de pixels par ligne qu'ils admettent. Il a été reconnu que les tout derniers systèmes de production de longs métrages faisaient appel à des appareils numériques de 3.000 lignes de résolution verticale et 2.500 pixels de résolution horizontale. Toutefois, ces systèmes n'étaient pas fabriqués sous la forme qui convenait pour numériser les documents sur papier de grandes dimensions. La résolution des caméras à CCD est principalement limitée par la taille de leurs puces électroniques. Des puces plus grosses permettent en théorie une plus haute résolution. Il est également possible de saisir les grands documents en plusieurs sections que l'on fera raccorder par le logiciel au moment de la visualisation.
Il convient chaque fois que possible de saisir les documents conformément à une norme élevée et d'effectuer ensuite, selon les besoins, des copies de moindre qualité à partir de cette première reproduction.
Les observations faites ci-dessus énoncent ce qu'il est réaliste de tenir pour possible dans la situation actuelle. La norme idéale peut être inapplicable aujourd'hui mais doit être gardée à l'esprit en tant qu'objectif à long terme. Un document en bon état que la technologie ne permet pas encore de saisir selon la norme idéale ne devrait pas être numérisé mais laissé en attente jusqu'à ce que le perfectionnement des techniques rende possible cette saisie idéale. Si, toutefois, le document considéré est en mauvais état ou fait l'objet de fréquentes demandes de consultation, il est alors recommandé de le numériser selon la meilleure norme existante possible. Pour surmonter les limites liées aux capacités du matériel de numérisation existant, il peut être souhaitable d'envisager d'effectuer des reproductions photographiques de haute qualité. On se souviendra cependant que les photographies sont elles-mêmes sujettes à dégradation.
2. Enregistrements sonores et images en mouvement
(a) Enregistrements sonores
En général, les normes techniques citées correspondent à la norme d'usage intermédiaire. Elles conviennent pour les transmissions faites à la norme d'interconnexion AES/EBU.
(i) Documents très anciens (cylindres, disques 78 tours)
| norme d'échantillonnage | bits/seconde | octets par heure |
| 48 kHz/20 bits
deux canaux | 1920,0 kbits/s | 864,0 Mo/h |
L'utilisation d'un lecteur stéréo et la numérisation séparée de chaque sortie lors de la copie de documents enregistrés à l'origine sur des supports à sillons permet d'enregistrer indépendamment le signal de chaque sillon alors même que les deux sorties sont théoriquement identiques. Ce peut être utile en cas d'utilisation de logiciels d'élimination des bruits parasites dus aux rayures des sillons et aux manipulations lors de lecture de la copie numérique.
(ii) Documents analogiques modernes (disques microsillons, bandes)
| norme d'échantillonnage | bits/seconde | octets par heure |
| 48 kHz/20 bits
stéréo |
1920,0 kbits/s | 864,0 Mo/h |
(iii) Documents numériques
Stockage à la même norme que l'original.
La norme d'échantillonnage des CD du commerce - 44,1 kHz/16 bits par canal - peut servir de norme de copie pour la consultation de base et la diffusion.
En cas de consultation sur réseaux et d'applications multimédia, la réduction maximale admissible des données est celle définie par la norme ISO/MPEG-1 (audio) Couche III pour un débit de 64 kbits/s par canal. Seules les copies destinées à la consultation en mode balayage ou aux catalogues devraient être numérisées conformément à une norme moins stricte.
(b) Vidéogrammes analogiques
En général, les normes techniques citées correspondent à la norme d'usage intermédiaire.
Il existe deux méthodes de stockage et de diffusion des signaux vidéo couleur. Le signal vidéo reçu sur ondes hertziennes ou par câble (NTSC ou PAL) ou visionné à partir d'une bande lue à domicile (VHS, BetaMax etc.) est un signal composite codé de manière à porter à la fois l'information couleur et l'information luminance.
Le sous-comité recommande l'utilisation d'un format en composantes consistant à stocker chaque fois que possible séparément un signal "luminance" (équivalant à une image monochrome) et deux signaux "différence de couleur" de moins bonne qualité. Ce format est plus gourmand en espace de mémoire mais présente des avantages lors de la copie ou de la conversion des signaux. Les normes citées se fondent sur la Recommandation 601 du CCIR visant la vidéo numérique en composite.
La norme 601 du CCIR prévoit deux longueurs de mot pour le stockage : 8 bits ou 10 bits. Les premiers magnétoscopes numériques (D1 à D3) utilisaient des mots de 8 bits mais la tendance est à l'utilisation de mots de 10 bits. Les tout derniers magnétoscopes numériques permettent le stockage par mots de 10 bits. On a retenu ici la norme la plus élevée dans le souci d'accroître la fidélité des images stockées.
| Norme d'échantillonnage | Bits par seconde | Octets par heure | |
| Luminance (Y) | 13,50 MHz/10 bits | 135 Mbits/s | 60,75 Go/h |
| Différence de couleur (U) | 6,75 MHz/10 bits | 67,5 Mbits/s | 30,38 Go/h |
| Signaux (V) | 6,75 MHz/10 bits | 67,5 Mbits/s | 30,38 Go/h |
| Totaux | 270,0 Mbits/s | 121,50 Go/h |
En pratique, le support le plus couramment utilisé aujourd'hui pour la consultation et la diffusion est la bande VHS. Sur le plan de la qualité, les bandes VHS sont plus en-deçà de la norme vidéo définie ci-dessus que les CD ne le sont de la norme audio qui précède. Le nouveau format numérique qui est proposé pour les bandes du type vidéo domestique pourrait garantir une meilleure qualité des copies de consultation.
En cas de consultation sur réseaux et d'applications multimédia, la réduction maximale admissible des données est celle définie par la norme MPEG-2 (Vidéo) pour un débit de 2 Mbits/s. Seules les copies destinées à la consultation en mode balayage ou aux catalogues devraient être numérisées selon une norme moins stricte.
(c) Vidéogrammes numériques
Stockage à la même norme que l'original.
(d) Films
La norme minime admissible pour réaliser des copies de consultation des films 35 mm serait une norme de la télévision à haute définition (TVHD). Toutefois, à l'époque de la rédaction du présent document, le domaine de l'enregistrement TVHD ne s'est pas encore stabilisé. Outre que le format préconisé en Amérique du Nord et au Japon (1.125 lignes, 60 trames par seconde) diffère de celui prôné en Europe (1.250 lignes, 50 trames par seconde), un certain nombre d'autres questions relatives aux formats d'enregistrement restent à régler.
Les deux formats TVHD de base permettent en principe l'un comme l'autre de réaliser des copies de qualité "Consultation" satisfaisantes. Tous deux sont utilisés pour tourner et produire des vidéogrammes promis à la télédiffusion ou au transfert sur des films destinés au public. Cependant, leur application présente souvent un caractère légèrement expérimental et fait appel à une gamme de matériels potentiellement incompatibles. Tant que les incertitudes entourant ces caractéristiques techniques n'auront pas été levées, le Sous-Comité demeurera dans l'impossibilité de formuler la moindre observation valable.
L'application d'une norme d'usage intermédiaire - propre à satisfaire les besoins de 99 % des usagers - à la copie des films 35 mm exigerait une capacité de stockage excédant en pratique les possibilités économiques actuelles. Certains systèmes spécialisés de restauration et de traitement dont les performances qualitatives dépassent celles que demanderaient les films 35 mm sont déjà utilisés. Cependant, ils ne permettent de travailler que sur de courtes sections. Chaque section achevée doit être recopiée sur un film car leur mémoire est insuffisante pour contenir en entier un long métrage de 90 minutes.
L'obsolescence des formats des enregistrements lisibles par machine et les problèmes qu'elle pose en particulier pour les collections de vidéogrammes ont été examinés.
Pour qu'un format d'enregistrement soit lisible par machine, il faut, par définition, que son support et la machine nécessaire pour accéder à ce qu'il contient soient en bon état. Or, par l'une de ces bizarreries propres à la technique, en raison de leur plus grande complexité, les formats les plus récents sont souvent plus menacés par l'obsolescence que les formats anciens. Construire par exemple un phonographe pour lire les cylindres d'Edison est à la portée de n'importe quel atelier relativement bien équipé. Construire des machines pour lire les formats des enregistrements modernes est une tâche beaucoup plus ardue.
Les milieux de la vidéo s'attaquent actuellement aux problèmes posés par le premier format des enregistrements commerciaux - sur bandes Ampex quadruplex de 2 pouces. La situation de ces enregistrements apparus vers la fin des années 50 est en passe de devenir critique. De nombreuses bandes présentent des signes de détérioration ; les machines à utiliser pour les recopier sont vétustes et les pièces de rechange correspondantes ne sont plus fabriquées ; les opérateurs expérimentés approchent de l'âge de la retraite ou l'ont déjà atteint ; la quantité de bandes à inspecter et à recopier est énorme - de l'ordre de plusieurs millions d'heures d'enregistrements ; la documentation relative à beaucoup de ces bandes est insuffisante pour permettre de sélectionner sans visionnage préalable celles qu'il faut recopier. Afin de sauvegarder le contenu de ces bandes, il faut pourtant en effectuer des copies. Beaucoup de services de télévision et d'archives en ont entamé la reproduction numérique mais c'est là entreprendre une véritable course contre la montre.
Une seconde crise se profile à l'horizon en ce qui concerne les formats de bande qui ont suivi les formats de 2 pouces - à savoir les formats de 1 pouce. Adoptés vers la fin des années 70, ils ont été utilisés par les producteurs jusque vers le début des années 90.
Au moins sept autres formats d'enregistrement analogique ont été ou sont largement utilisés par les cadreurs amateurs et professionnels. A l'échelle mondiale, le problème est multiplié par la disparité des normes vidéo utilisées dans les différentes régions du globe. Les services d'archives et bibliothèques peuvent se voir offrir des documents utilisant n'importe lequel de ces formats. Seuls les services d'archives vidéo les plus vastes et les mieux équipés sont a priori à même de traiter toute cette gamme de formats et normes.
Depuis l'introduction du premier format vidéo numérique (D1) vers le milieu des années 80, au moins quatre autres ont été lancés. Aucun n'occupe une position dominante sur le marché. Le format D1 lui-même est aujourd'hui pratiquement obsolète.
Pour résoudre ce problème, il faut des techniciens qui sachent manipuler des documents de différents formats. Il faut aussi que les institutions possèdent des spécimens de machines obsolètes en état de marche - impératif qui rend la présence de techniciens spécialisés et hautement qualifiés d'autant plus nécessaire. A l'heure actuelle, il n'existe nulle part au monde de formation s'adressant aux techniciens des services d'archives. Quelques établissements seraient théoriquement à même d'en offrir mais il faut trouver les moyens financiers leur permettant d'organiser et d'administrer les cours qui conviendraient.
La formation des techniciens n'est pas une question d'ordre purement technique. La technologie moderne offre de multiples moyens de modifier les documents lors de leur reproduction. Les aspects éthiques de la copie d'archives doivent donc être enseignés, outre ses aspects techniques.
Les services d'archives et bibliothèques d'enregistrements sonores et d'images en mouvement ont besoin d'un format de stockage qui ne soit pas dicté exclusivement par les impératifs des entreprises de radiodiffusion et télévision, des éditeurs ou des fabricants. Ce format devra admettre des documents de plusieurs types de sorte que, par exemple, le son numérisé d'un disque microsillon puisse être stocké avec l'image de la photographie ornant sa pochette et le texte qui l'accompagne. Il est préférable d'adopter un système de stockage qui ne restreigne pas le flux de données numériques - autrement dit une mémoire à structure non imposée. Or la plupart des systèmes commerciaux fabriqués en série qui existent actuellement exigent que l'information soit mise sous une forme spécifique préalablement à l'enregistrement.
Un certain nombre de constructeurs proposent maintenant des systèmes de stockage entièrement automatisés qui s'autovérifient et s'autorenouvellent. La capacité qu'ils ont de recopier et de vérifier des supports sans intervention ou surveillance humaine constante permet de transférer des collections dans de nouveaux systèmes chaque fois que le besoin s'en fait sentir sans encourir les très importants coûts de main-d'oeuvre indissociables du transfert de supports analogiques ou de supports numériques rangés sur des rayonnages.
Ce n'est pas là de la science-fiction. Les systèmes
de ce type commencent d'être installés dans certains
services d'archives et bibliothèques d'enregistrements
sonores. Ils sont également utilisés dans un certain
nombre d'autres lieux, tels que les établissements bancaires
et de recherche scientifique, qui ont besoin de stocker d'énormes
quantités d'information numérique. Ils seront également
à la base de nouveaux services aux consommateurs tels que
la "vidéo sur demande".
Up
| Abdelaziz ABID
Programme général d'information (PGI) UNESCO 1, rue Miollis 75015 Paris France | Tél : +33 (1) 4568 4496 Fax : +33 (1) 4449 0058 Courrier électronique : a.abid@unesco.org |
| Michael ALEXANDER The British Library Computing and Telecomms Boston Spa Wetherby West Yorkshire LS23 7BQ Royaume-Uni | Tél : +44 (1937) 546883 Fax : +33 (1937) 546872 Courrier électronique : michael.alexanderbl.uk |
| Julian BESCOS Codirecteur du Projet Archivo de Indias Codirecteur, Société "Archivos y Bibliotecas", créée par IBM Espagne et El Corte Ingles Apartado Correos 179 28080 Madrid Espagne | Tél : +34 (1) 397 9206 Fax : +34 (1) 735 1440 |
| George BOSTON 14 Dulverton Drive Furzton Milton Keynes MK4 1DE Royaume-Uni | Rapporteur Tél : +44 (1908) 502610 Fax : +44 (1908) 502520 Courrier électronique : gbostongn.apc.org |
| Dietrich SCHÜLLER Director Phonogrammarchiv Österreucguscgeb Akademie der Wissenschaften Liebiggasse 5 A-1010 Vienne Autriche | Président Tél : +43 (1) 40103 2734 Fax : +43 (1) 403 0465 Courrier électronique : pharchivkfs.oeaw.ac.at |
Ont également pris part aux débats ou fourni à diverses occasions leurs avis et observations :
| Bill BULFORD BBC Television Television Centre Wood Lane Londres W12 7RJ Royaume-Uni | Tél : +44 (181) 576 1566 Fax : +44 (181) 576 1639 |
| Michael CROLL BBC Research Department Kingswood Warren Tadworth Surrey Royaume-Uni | Tél : +44 (1737) 836612 Fax : +44 (1737) 836665 |
| Brian JENKINSON National Film and Television Archive John Paul Getty III Conservation Centre Kingshill Way Berkhamsted Hertfordshire Royaume-Uni | Tél : +44 (1442) 876301 Fax : +44 (1442) 862085 |
| Jacques KLOSSA Directeur général TRIBUN-VTCOM (France TELECOM) 40, rue Gabriel Péri 92240 Malakoff France | Tél : +33 (1) 4612 6971 Fax : +33 (1) 4612 6980 |
| Franz LECHLEITNER Phonogrammarchiv Liebiggasse 5 A-1010 Vienne Autriche | Tél : +43 (1) 40103 2740 Fax : +43 (1) 4030465 Courrier électronique : pharchivkfs.oeaw.ac.at |
| John NUNN BBC Radio Room 4102 Broadcasting House Portland Place Londres W1A 1AA Royaume-Uni | Tél : +44 (171) 765 3522 Fax : +44 (171) 765 3822 |
Un concours a également été reçu de :
| Harald GARDOS
Secrétaire général Commission autrichienne pour l'UNESCO Mentergasse 11 A-1070 Vienne Autriche | Tél : +43 (1) 523 64 21 ou +43 (1) 526 36 80 Fax : +43 (1) 526 13 01 |