Table des matières
-
Précédente - Suivante![]()
VII - Classement et description
L'Indexation-matières à vocabulaire contrôle
dans les archives
Les méthodes modernes de classement d'archives
aux États-Unis
Les instruments de recherches dans les archives
L'Indexation-matières à vocabulaire contrôle dans les archives
par
Lionel BELL
Nature de l'indexation-matières des archives
Classification
et cohèrence
Informatique
et édition
L'application aux papiers ministeriels. Le
niveau d'indexation
Les papiers ministeriels. Construction et emploi
de la classification externe
Appendice : Papiers ministeriels de 1938
Nature de l'indexation-matières des archives
L'information contenue dans les archives peut être appréhendée de plusieurs manières et la recherche par sujets, au moyen d'un index-matières, n'a pas été, ordinairement, assurée autant que dans les bibliothèques. Les raisons de ce fait et les distinctions entre les documents des bibliothèques et ceux des archives doivent être examinées, avant qu'on puisse tenter de considérer une approche plus systématique des sujets des archives. Cet examen est particulièrement nécessaire parce que de telles approches systématiques ont été menées dans le champ des bibliothèques et il serait mal avisé de négliger la possibilité d'emprunts techniques aux bibliothèques à l'usage des archives. Mais, d'un autre côté, quand des méthodes de bibliothèque ont été mises au point pour régler des problèmes spécifiques aux bibliothèques, il serait imprudent de succomber à la tentation d'utiliser ces méthodes pour la simple raison que ces techniques très fouillées ont été expérimentées et reconnues valables.
C'est une tradition archivistique que les archives, à la différence des livres et des articles, participent à l'objet historique plutôt qu'elle ne le concernent ; et quoique l'on doive parfois restreindre la portée du principe général, il y a une différence suffisante pour que l'on différencie les procédés d'indexation. Par exemple, même le plus détaillé des articles ne pourrait que traiter du recrutement et de l'organisation d'une armée contractuelle en 1337, alors que les archives sont les contrats passés par des parties particulières pour des fins particulières, à des jours particuliers, et les comptes portant les paiements faits en conséquence, etc. Par suite, la possibilité d'appréhender les archives au moyen d'index nominatifs a été à la fois évidente et évidemment utile, si bien que l'on a ordinairement élaboré de tels index, tandis qu'une appréhension thématique et détaillée a souvent paru difficile ou inadéquate. Lorsque des mots-matières apparaissent dans des index d'archives, ils sont souvent subordonnés à un nom, comme dans : "Suisse, taxe sur les pommes de terre" ; cependant le mot-matière peut, à l'occasion, apparaître pour lui-même à un autre endroit du même index et, dans ce cas, le nom peut lui être subordonné, c'est-à-dire qu'il peut y avoir une entrée supplémentaire : "Taxe sur les pommes de terre en Suisse". La fréquence de cette combinaison d'entrées commençant par un mot-matière ou par un nom joue sur la structure des index-matières ou, plus proprement, sur les index d'archives généraux. En règle générale, ces structures ont un caractère alphabétique bien marqué, et ce n'est que rarement que l'on essaie de classer les entrées dans un ordre dépendant des relations que les concepts peuvent présenter entre eux.
Le classement des archives en fonction de leur provenance administrative aide bien à rétrécir le champ des recherches documentaires. Lorsque l'on fait une recherche, presque tous les Départements administratifs peuvent être écartés pour des raisons de chronologie ou de compétences, d'une façon qui n'a pas d'égale dans le domaine des bibliothèques ; dans leur cas, on peut parvenir, par un seul catalogue méthodique, à tous les articles ; dans le cas des archives en revanche, une fois déterminés les Départements ou les fonds qui peuvent être utiles, on emploie les différents moyens de référence, qui n'ont donc pas besoin de présenter un caractère très général. Toutes les entrées, dans de tels instruments de recherche, sont d'une nature spécifique, alors que dans les catalogues des bibliothèques, les concepts généraux régissent non seulement la structure de la classification mais encore fournissent des articulations pouvant regrouper des références à des ouvrages généraux, y compris les plus généraux de tous, les encyclopédies. Il n'y a pas d'archives générales en ce sens.
Choisir les Départements administratifs ou les fonds d'archives susceptibles d'être utiles, ce n'est naturellement pas une petite affaire et cela dépend souvent beaucoup du guide général du service d'archives et particulièrement de l'index-matières de ce guide. Parce qu'il est le premier instrument de recherche pour de nombreuses questions et parce que son index renvoie à des notices descriptives de Départements et de fonds et non à des documents, il peut avoir plus de points communs avec les techniques employées dans les bibliothèques qu'avec les index d'archives qui font l'objet de cet article.
Des éléments plus généraux peuvent se présenter, surtout si une bonne partie des fonds concernés sont des dépôts, dépourvus d'une origine administrative qui circonscrive leur champ. Pour cette raison, si l'on essaie, par exemple, de systématiser l'indexation de plusieurs guides ou de descriptions au sein du guide, on peut bien employer des méthodes de bibliothèque jusqu'à un point qui n'est pas souhaitable pour les index d'archives. La même chose est vraie des index-matières partant sur tous les articles d'un service d'archives qui existent, sur fiches par exemple, en dehors d'un guide imprimé. En outre, les index établis pour des archives déposées ou pour des archives historiques privées ainsi que les index dressés pour les descriptions au sein d'un guide peuvent être d'un abord plus général et plus structuré que les index d'archives très spécifiques.
Les observations qui suivent à propos des index d'archives doivent donc s'entendre indépendamment de ce qui concerne les index que l'on a distingués ci-dessus.
La classification, qui consiste à regrouper des sujets connexes sous un seul titre, a été, naturellement, employée régulièrement dans les index d'archives, pour des raisons largement méthodologiques et avec une méthode alphabétique. Non seulement l'ordre alphabétique a été le fondement du classement à l'intérieur d'une rubrique, mais encore les titres des rubriques ont été eux-mêmes classés alphabétiquement pour former l'index dans son ensemble. Je ne connais pas de cas où l'on ait essayé de regrouper des rubriques connexes d'une façon complètement logique quoiqu'on trouve un aspect de ce type de classification dans la rubrique "Actions" (procès) de l'index-matières des Curia Regis Rolls. Dans l'ensemble, l'index général, combinant les matières et les noms, comme on en trouve un exemple dans le Main Index (Index principal) du Foreign Office, a été plus répandu que l'index-matières distinct, tel celui des Curia Regis Rolls, et si l'on considère la nature des recherches menées dans les archives, qui dépendent aussi du caractère particulier des documents, cela est certainement convenable. Quand on fait une recherche particulière combinant des éléments nominatifs et des éléments abstraits, il est plus commode d'avoir un seul index dans lequel on peut pointer l'une ou l'autre entrée recherchée, et il est généralement préférable que les entrées soient présentées comme des articles particuliers plutôt que réunies en groupes. Il y a, naturellement, de nombreux cas où l'auteur d'un index peut raisonnablement penser que quelqu'un qui s'intéresse à un sujet A peut également s'intéresser à un sujet B. si bien que, dans cette mesure, il est commode de les présenter ensemble sous une rubrique plus générale. Je suis certain qu'il y a eu bien plus de cas dans lesquels le regroupement a été méthodologique dans son principe et tout à fait indépendant du souci d'aider le lecteur, à tel point qu'une tendance s'est développée qui condamnait toute entrée particulière. On a fait des index dont toutes les entrées ont été réparties entre des rubriques abstraites (qui régissent ainsi la position des entrées dans l'index), même quand ces rubriques ne comptaient qu'une seule entrée, de sorte qu'il n'y avait pas de regroupement analogique. Tel est l'arrière-plan méthodologique.
L'une des grandes difficultés que rencontrent les auteurs d'index-matières, notamment par rapport aux auteurs d'index nominatifs, c'est la cohérence : ils ont constamment à se demander : "cette matière a-t-elle déjà été indexée ?", ou, en d'autres termes, "ai-je indexé, à tel ou tel niveau, ce type de document ?" et encore : "cette matière doit entrer dans l'index, mais quel vocabulaire ai-je employé ?". Pour parvenir à cette cohérence, on a alors un besoin constant de se reporter à des index antérieurs d'ensembles d'archives ou à des étapes précédentes de l'index en cours, et ce type de contrôle est facilité si l'auteur de l'index sait qu'une matière particulière, quand elle apparaît, entre dans un groupe particulier, quel que soit le vocabulaire utilisé pour la décrire. Car un groupe de ce genre est plus bref à examiner qu'un index tout entier et c'est, de toute façon, un groupe de précédents plutôt que des entrées isolées que l'auteur de l'index doit considérer de temps en temps pour maintenir la cohérence. Les utilisateurs de l'index, d'autre part, peuvent très souvent rechercher directement l'entrée particulière dont ils ont besoin, surtout dans le cas d'un index offrant de nombreuses entrées spécifiques introduites par des noms. En ce qui concerne les entrées-matière directes, il est souvent inutile d'imposer une étape intermédiaire consistant à décider quel groupe (ou quels groupes) de matières on doit considérer, même quand cette décision est simplement une affaire de renvois. Cela ne signifie pas, comme on l'a déjà remarqué, qu'il n'y a pas d'exemples où un chercheur s'intéressant à A puisse tellement s'intéresser à B qu'il soit juste, de son point de vue, de regrouper ces termes. Cela ne signifie pas non plus qu'il n'y ait pas de chercheurs qui aient besoin d'une sorte de classification pour restreindre leurs recherches plus générales. Mais cela signifie que, dans l'ensemble, les index-matières d'archives doivent comporter des entrées spécifiques particulières et, notamment, que tout regroupement d'entrées devrait être effectué dans l'intérêt du chercheur et non pour un quelconque avantage mécanique et momentané dont l'auteur de l'index puisse profiter.
La nature du document impose la spécificité dans l'analyse ; le maintien de cette spécificité dans la composition de l'index est avantageux pour le lecteur. Il est donc improbable qu'une classification préfabriquée puisse servir à indexer des archives, comme on l'a fait pour les besoins des bibliothèques. Diverses séries d'archives diffèrent très sensiblement de contenu, et il est plus avantageux de développer autant que nécessaire la classification pour indexer une série. Comme on l'a montré, ce besoin, en termes quantitatifs, peut n'être point considérable quoique, dans chaque cas, il faille une espèce de contrôle de la cohérence, mais ce besoin est celui d'un produit sur mesures. La situation peut bien être différente pour l'indexation systématique des guides de Services d'Archives ou des informations analogues, et il serait souhaitable, si possible, que tous les guides soient indexés de la même manière ou que des index conjoints soient préparés pour ces guides.
On a donc besoin d'index spécifiques, en ce sens que les entrées, dans l'ensemble, ne sont pas disposées par groupes-matières ; d'index généraux en ce sens que matières et noms apparaissent dans un seul ordre, et non séparément, et d'index dotés néanmoins d'une sorte de contrôle de la cohérence. La question est de savoir si l'on peut établir de tels index de façon systématique, et en particulier avec l'aide de machines. La question connexe du remplacement des index par des machines, je ne propose pas de la considérer dans l'idée que les lecteurs d'archives préféreraient avoir des index conventionnels qui peuvent être portés, envoyés et consultés n'importe où, et que les techniques si avancées des systèmes d'interrogation seraient mal adaptées aux recherches dans les archives. Puisque l'élaboration d'un index-matières implique une succession de décisions, dont chacune devrait être un précèdent, nous devrions examiner si ces décisions peuvent être enregistrées de façon que ce précédent s'effectue ensuite automatiquement, chose qui épargnerait à l'auteur de l'index le laborieux contrôle des précédents ou la prise de décisions là où des décisions ont, déjà, été prises. Cela doit naturellement permettre de modifier les décisions de l'auteur de l'index ou l'économie du système.
Quand les index sont stockés sous une forme qui peut être lue automatiquement, ils peuvent être mêlés pour constituer des index communs ou pour en produire des listes sélectives, pourvu qu'ils aient été établis de façon concordante ou qu'il y ait un système pour abolir les incohérences. Si un système de ce genre peut permettre d'éviter des tâches de copiste dans la construction d'un index, les possibilités de fusions ou d'extraits sélectifs peuvent être considérées comme un bénéfice.
Cela m'amène à la question de la cohérence, dont on a dit que c'était la qualité essentielle d'un index satisfaisant. Si un index doit donner satisfaction, il doit être cohérent, entre autres, dans le choix des choses et des idées à indexer et aussi, pour dé nombreux documents, dans le choix des noms. Des documents semblables devraient être indexés de façon semblable, en ce qui concerne le détail, le niveau et l'appréhension. Je ne vois aucune possibilité de mécaniser de tels choix. Les termes servant à indexer un texte peuvent ne pas apparaître dans ce même texte, ce qui aurait permis de les extraire grâce à un crible mécanique, et, même pour les noms, il ne paraît pas y avoir de règles sures permettant de les extraire du texte pour les intégrer dans un index. Combien est-il encore moins possible, alors, de plier à des règles le choix des mots-matière, puisqu'il dépend de la connaissance du sujet et de l'évaluation de l'intérêt du texte, bref, de la compréhension du texte ? On peut être assuré que les entrées correctes d'index dans ce domaine ne peuvent être préparées que par l'intervention de personnes qui doivent conserver la responsabilité de leurs choix, même si, comme on le verra, elles peuvent s'aider de moyens mécaniques.
Le point suivant est de vérifier que le vocabulaire employé est cohérent avec celui qu'on a employé auparavant, que la même notion est exprimée dans les mêmes termes, et que toute forme de classification ou de regroupement utilisée précédemment est toujours utilisée. Dans la plupart des index d'archives, les entrées n'ont que leur terme (ou groupe de mots) initial qui soit traité comme une matière, et toutes les modifications, subséquentes, de ce terme initial sont simplement classée de manière alphabétique ; ainsi, on peut trouver : "Exportations, d'armes par l'Allemagne", et "Exportations, promotions (des), par la politique gouvernementale", sans qu'on essaie d'établir des relations logiques entre le terme initial et le développement variable, ni de classer ces variables selon des schémas standardisés ou des ordres logiques. Il s'ensuit que toutes les décisions précédentes concernent ces termes qui consistent eux-mêmes en un ou deux mots, et que toutes ces décisions peuvent être conservées indépendamment de l'index. Ces décisions n'influent pas nécessairement sur sa composition, quoiqu'elles le puissent, et on peut s'y référer par des mots correspondants. Cela peut se faire mécaniquement.
On a suggéré, dans le cas d'entrées consistant en termes et en relations définies, qu'on pourrait-élaborer une classification qui puisse se développer automatiquement à partir des relations i. Cela n'est pas possible ici, puisqu'il n'y a pas de relations dans les entrées ; mais on pourrait, jusqu'à un certain point, former une classification qui se développe naturellement grâce à l'enregistrement de toutes les décisions prises pour le vocabulaire et le classement. Il en va ainsi dans la mesure où une classification est faite de décisions concernant le vocabulaire et le classement de l'index lui-même, c'est-à-dire au niveau inférieur ; mais les niveaux supérieurs, nécessaires pour garantir une cohérence complète, doivent être une création délibérée.
L'ensemble de la classification qui consiste en ces deux éléments peut être conservé indépendamment de l'index, les entrées proposées peuvent lui être confrontées et il peut lui-même être imprimé totalement ou partiellement selon le besoin. On peut ainsi avoir la direction générale qui est nécessaire à la construction cohérente d'index successifs sans qu'on touche au classement interne de ces index dans leur forme publiée, sauf quand on a pris une décision concernant le classement interne en considérant l'avantage de l'utilisateur.
La classification, en ce sens, consistera dans les décisions prises à propos des regroupements et des synonymes au sein de l'index, et aussi dans le classement, selon un plan logique, des termes qu'on peut accepter comme mots-souche pour l'index. Ces mots-souche ou termes initiaux apparaîtront alphabêtiquement dans l'index et régiront de ce fait son agencement, mais ils seront arrangés conceptuellement dans la partie supérieure de la classification. Toute la classification sera formée de termes liés par l'une de ces trois sortes de relations. Dans l'index, il y aura une relation subordonnée dans laquelle A, pour les besoins dudit index, sera un sous-titre de B. si bien que toutes les entrées relatives à A se trouveront à : B. A. Entre les mots-souche et la partie supérieure (ou externe) de la classification et aussi dans cette dernière, il y aura une relation qui sera largement, mais pas entièrement, de subordination ; ainsi, il arrivera souvent que A soit un exemple ou un élément de B. mais A pourrait aussi être un aspect de B ou avoir une parenté avec B.
Le divorce des éléments subordonnés, variables, et de référence, de l'entrée indexée d'avec les termes qui entrent dans la classification a un heureux effet sur cette dernière et sur l'index.
La classification externe est beaucoup moins encombrante que celle qui informe et s'exprime en un index complet, et, parce qu'elle est compacte, elle n'a plus besoin d'être strictement hiérarchisée. Dans un classement tout à fait hiérarchisé, tout concept a sa place sous un seul autre concept avec lequel il a une relation de subordination, tandis que, si l'on a assez d'espace, on peut inclure les multiples relations des concepts. Ainsi, nous pouvons relier le mot "réarmement" à la fois à "industrie" et à "armes", et dans ces deux relations il sera associé à deux groupes différents de mots-souche apparentés. L'expression d'un tel réseau multidimensionnel implique beaucoup de répétitions et n'est possible que si les termes à relier ne consistent qu'en un mot ou deux ; il ne pourrait être réalisé même dans un petit index parce que la nécessaire répétition des entrées - chacune comportant mot souche, terme subordonné, variable et référence - serait impraticable.
Le réseau multidimensionnel donne une image bien plus fidèle de la situation conceptuelle que l'architecture hiérarchisée dont la rigidité doit être brisée par l'emploi de renvois indiquant des relations non indiquées par la classification si l'on s'en sert.
Cette idée de la classification séparée de l'index a ses antécédents. Dans l'Inventaire des archives de la ville de Strasbourg, série VII, il y a une table des groupes de mots-souche tirés de l'index, sous des rubriques telles que "histoire militaire" et "vie intellectuelle". Cela a pour but d'économiser l'espace des renvois et des entrées répétées. Un procédé quelque peu semblable a été utilisé pour l'index-matières du Calendar of liberate rolls, vol. VI, afin de renvoyer aux groupes rassemblant des entrées, tels que "arms, armour" et "trades and occupations" ; les termes apparaissant ici sont intermédiaires entre les deux niveaux de termes employés pour l'index de Strasbourg. Dans ces deux cas, les tables initiales dépendaient de ce qui entrait dans l'index, à la différence du type de classification élaboré dans les bibliothèques, classification qui est alors préparée à l'avance et destinée à satisfaire tous les besoins, et qui, ensuite, régit le classement des livres ou le catalogue, plutôt qu'elle n'en découle.
Il est, bien sûr, beaucoup plus aisé de développer à partir d'un index ou d'une série d'index juste la classification nécessaire que d'établir in vacuo une classification générale applicable au classement d'articles encore virtuels.
Cela nous amène à un autre caractère indispensable du système, à savoir qu'il doit être possible de corriger et d'étendre la classification selon les besoins. Cela doit se faire de façon cohérente après un examen de la classification existante, et sans détruire l'utilité des index existants. En particulier, on ne doit pas affecter les possibilités de fusion ou d'extraction des index. Dans la mesure où l'index n'est pas façonné par la classification, ces possibilités sont préservées et, pour autant que l'index soit arrangé selon la classification, des problèmes de rénovation peuvent toucher la forme sous laquelle est conservé l'index à lecture automatique. Hormis la possibilité de fusion, l'intérêt des index antérieurs subsiste simplement du fait de leur existence indépendante sous forme imprimée, sans préjudice de ce qu'on peut faire aux versions à lecture automatique.
Le fait que la classification existe en dehors de tout index réel permet ainsi de la modifier sans dommage ; cette existence distincte a aussi son effet sur le style de l'indexation. Le rédacteur de l'index peut viser àidentifier les aspects importants du document et à les exprimer dans le vocabulaire qui est immédiatement approprié" tout en sachant que la combinaison de ces aspects dans des points de vue plus généraux et la comparaison de son vocabulaire avec celui qui a été employé précédemment seront effectuées séparément et, dans une certaine mesure, automatiquement. Cela devrait l'encourager à rédiger des entrées d'index spécifiques plutôt que générales, dans lesquelles son analyse suive de près la teneur du document. Une telle spécificité, on l'a déjà montré, est un caractère souhaitable des index d'archives.
Chaque fois qu'on imprime un index réalisé, il faudrait imprimer aussi et publier en introduction à cet index la partie externe de la classification qui concerne les termes utilisés comme mots-souche dans ledit index. Les rubriques de cette partie de la classification devraient apparaître - ou être l'objet de renvois - selon l'ordre strictement alphabétique, de sorte que celui-ci serve d'index à la classification comme aux archives. Avec les classifications de bibliothèque, un index alphabétique s'impose ordinairement et on peut avoir, ici, très simplement le même caractère.
La classification externe, ayant désormais joué son rôle en contrôlant le vocabulaire et, dans une faible mesure, la forme de l'index, peut offrir une aide plus directe au lecteur de l'index. Dans nombre de cas, le lecteur peut aller directement aux termes qui l'intéressent, et c'est pourquoi la spécificité est pertinente, mais certains utilisateurs peuvent se demander par où entrer dans l'index, ou ne pas réussir à y entrer avec les termes qu'ils ont à l'esprit. La classification distincte offrira aux utilisateurs une vision commode de l'index. Même ceux qui ont réussi à entrer dans l'index et ont trouvé leur référence peuvent apprécier d'être guidés vers des idées associées dans la classification, et dans cette démarche ils peuvent s'assurer qu'ils ont bien tout vu, qu'ils ont regardé à tous les termes de l'index qui pourraient les intéresser. Cela se fait, d'une façon qui n'a rien de systématique, par l'emploi des "voir aussi" dans les index classiques d'archives ; de tels renvois ne seront plus utiles.
Pour construire un index on pourrait utiliser un ordinateur de la manière suivante : on lui présenterait des entrées d'index consistant en mot-souche, variable et référence, et il commencerait par examiner les mots-souche pour écarter les mots reconnus comme noms, soit de personnes, de lieux, de véhicules, de personnes morales ou de documents. Il devrait être entendu que la notation de ces noms spécifiques et des termes-matière doit faire partie des données intégrées dans la mémoire informatique. On devrait pouvoir noter les termes-matière apparaissant en entrées après un nom, comme dans : "Allemagne, exportation d'armements par". Les termes-matière ainsi mis en valeur seraient alors confrontés à la classification mémorisée afin de savoir s'ils y ont une place. Cette confrontation serait exécutée de manière àn'être point affectée par l'usage du pluriel ou du singulier, des majuscules ou des minuscules. Cette épreuve peut avoir six résultats.
On peut accepter le terme comme mot-souche ; dans ce cas, l'entrée peut être mise de côté pour apparaître dans l'index sous sa forme de donnée mémorisée.
Le terme peut avoir été catalogué comme le synonyme d'un mot-souche convenable : ce dernier est alors substitué au terme original, on fait un renvoi du terme original au mot-souche qui est mis de côté avec l'entrée revue, comme auparavant.
Troisièmement, le terme peut avoir été catalogué comme le sous-titre d'un mot souche convenable : celui-ci est alors ajouté à l'entrée devant le terme original ; on fait un renvoi de ce terme original au mot-souche ; ce dernier et l'entrée revue sont mis à part, comme précédemment.
La quatrième possibilité, c'est que le mot-souche suggéré ne se trouve dans la classification qu'à un niveau supérieur et, alors, l'entrée doit sortir comme rejetée, avec l'indication de cette information.
Cinquièmement, le terme peut présenter deux sens ; il est noté comme homonyme ; il est, à nouveau, rejeté, avec indication de cette information.
La dernière possibilité, c'est, bien sûr, qu'on ne trouve pas le terme et l'entrée est ainsi éditée comme un rejet non-sortable.
Il appartient désormais à l'éditeur de l'index de considérer ces rejets et de modifier ces derniers ou le système, de manière à les rendre acceptables. On peut le faire, soit en augmentant le nombre des mots-souche convenables - procédé qui est réglé par le besoin d'insérer de nouveaux mots-souche dans la classification -, soit en marquant les termes proposés pour servir d'entrées comme synonymes ou soustitres de mots-souche existants, soit en réécrivant les entrées avec des mots-souche convenables. On discutera de cette édition avec plus de détails par la suite, mais on doit remarquer dès maintenant qu'il est inéluctable qu'une intervention humaine de cette espèce se produise au cours de ce processus pour indexer les archives de façon correcte. Cela s'applique à la fois aux matières et aux noms, et peut devenir un sérieux obstacle à l'utilisation économique de la machine pour aider à la création de l'index.
On peut confronter à nouveau l'entrée informatique revue à la classification revue, en ayant soin de vérifier les données précédemment acceptées pour le cas où une modification inopinée de la classification les aurait rendues inacceptables. Toutes les entrées devraient alors entrer dans les trois premières catégories et, àce point du processus, on devrait s'assurer que le segment approprié de la classification est prêt pour l'édition.
L'application aux papiers ministeriels. Le niveau d'indexation
Avant, toutefois, de pouvoir procéder ainsi, on doit créer manuellement le premier index d'une série quelconque ainsi que sa classification. C'est ce qu'on a fait pour les papiers ministériels de 1938, et un index pour ceux de 1937 a été assorti et édité dans le système. Cet exercice a mis en relief quelques points qui méritent discussion. On a déjà fait remarquer que dans des entrées commençant par un nom suivi d'un terme-matière, on devrait pouvoir marquer la matière de façon qu'elle puisse être traitée dans le système-matières. Alors, le plus simple serait ordinairement que le nom et le terme-matière apparaissent aux lieux appropriés dans la classification éditée pour l'index, quoique naturellement le nom ne serait pas intégré de manière permanente dans le système. L'autre possibilité serait de créer automatiquement un renvoi de la matière au nom, et certains rédacteurs d'index peuvent préférer ce procédé. On peut trouver une solution, cependant, sans utiliser l'une ou l'autre de ces méthodes, en faisant une entrée d'index supplémentaire lorsqu'on indexe le document pour la première fois : alors tout ce qui suit le nom dans la première entrée serait traité comme une simple variable, dépourvue de rôle dans la création de l'index si ce n'est pour déterminer la position alphabétique de l'entrée.
C'est la méthode adoptée, presque exclusivement, dans l'index des papiers de Cabinet, et il serait souhaitable que chaque type d'index soit doté d'une règle générale déterminant la méthode que doit suivre le rédacteur de l'index.
Pour illustrer ces trois méthodes, prenons l'entrée "Allemagne, exportation d'armements par".
Dans la première méthode, le rédacteur indiquerait, par un soulignement peut-être, que le mot "exportation" est à traiter en matière et, dans la classification, "Allemagne" et "exportation" apparaîtraient tous deux comme des aspects de "commerce", mettons.
Dans la second méthode, on emploierait le même marquage, mais "exportation" seulement apparaîtrait comme un aspect de "commerce" et le système créerait un renvoi "Exportation, VOIR : Allemagne".
Dans la troisième méthode, le rédacteur de l'index ne marquerait pas en matières la première entrée mais écrirait une autre entrée : "exportation d'armements par l'Allemagne", comme avec l'une de ces méthodes hormis la permutation complète il écrirait une autre entrée commençant par "armements".
Cette pratique des entrées répétées, je propose de l'appeler "entrées croisées" (cross entry). Dans les index de noms, dépourvus de classification externe qui guide dans l'index, renvois et entrées croisées sont les seules solutions pour un couple de noms liés, et je considérerais les renvois comme une méthode probablement plus pertinente, dans ce cas, que dans celui des index-matières. Dans l'exemple ci-dessus, le lecteur se reportera à "exportation" parce que c'est ce qui l'intéresse ; il ne sera guère ravi de mener sa recherche en cherchant à une demi-douzaine de noms différents. Dans tout système donnant des renvois, toutefois, le rédacteur de l'index peut contourner la difficulté en s'abstenant de noter la dernière partie de l'entrée, de façon qu'elle soit traitée en simple variable. Il peut ensuite introduire lui-même l'entrée croisée qui lui convient.
Comme on l'a vu plus haut, le système envisage en tous cas des entrées croisées entre les matières. Il serait difficile de créer automatiquement des renvois fondés sur les relations internes dans des groupes tels que "exportation d'armements", même si les renvois devaient atteindre un plus haut degré d'élégance que "armements, VOIR : exportation d'armements". Il en va de même de la création automatique d'entrées croisées, comme dans l'indexation permutée (quoique les entrées croisées épargnent les difficultés de renvoi, dues au choix de l'élément auquel tous les autres doivent renvoyer) dans laquelle les résultats seront presque certainement inconsistants quand un grand nombre d'entrées sont classées alphabétiquement dans un seul index. La difficulté fondamentale dans cette sorte de permutation est que le processus ne peut pas s'appliquer directement à la teneur des documents mais seulement à des analyses condensées de ces textes. Quand il existe déjà de telles analyses, comme dans un répertoire de dossiers, l'indexation permutée fondée sur une notation simple peut avoir un heureux résultat, qui n'est pas toutefois d'une qualité comparable avec ce qui résulterait du travail d'indexeurs humains. En l'absence de ces analyses condensées, il est inutile d'employer des personnes qui fassent tous leurs efforts pour établir des analyses particulières couvrant tous les aspects d'un document, et de permuter ensuite les analyses automatiquement. On peut employer à meilleur escient ces personnes à rédiger en langage naturel tous les aspects qu'elles jugent dignes d'être notés. La permutation des analyses concernant des noms, domaine dans lequel l'étendue des relations internes et du vocabulaire est limitée, est une autre affaire. Permuter "Oxford, maire de, Voir : Smith" à partir de "Smith, John, maire d'Oxford" peut effectivement être un procédé judicieux.
Le rédacteur d'un index devrait donc écrire une entrée pour chaque aspect du document qui, à son avis, doit être mis en valeur. Dans certains cas, le traitement des mots suivant un nom comme simples variables, négligeables du point du vue des matières, convient très bien à leur nature, comme dans "Allemagne, situation en". Cependant, il peut y avoir des cas pour lesquels il est difficile de rédiger une entrée-matière pour couvrir un aspect qui mérite néanmoins d'être traité et d'être accessible dans la classification. Alors, le terme approprié dans la classification pourrait être doté d'une annotation permanente, sous la forme "Affaires étrangères (VOIR AUSSI : les pays et régions cités)".
Quoique le renvoi de matières à des noms (exportation, VOIR : Allemagne) ne puisse être élaboré par le système décrit, on devrait prendre des dispositions pour permettre au rédacteur de l'index de les préparer manuellement et de les intégrer s'il le désire. La matière concernée devrait convenir à la classification comme tout autre matière. "Lois" et "projets de loi" en sont des exemples dans l'index des papiers ministériels. Les termes-matière qui ont leurs places particulières dans la classification devraient autant que possible être des substantifs ou des groupes de mots plutôt que des adjectifs car ceux-ci n'apparaîtront que maladroitement dans la classification éditée ; mais ils peuvent être aussi de simples pléonasmes pour le substantif qu'ils accompagnent. Bien souvent, toutefois, cela ne sera pas possible et l'on devra admettre le caractère de répétition qu'on trouve en ayant à la fois "agriculture" et "agricole" dans le système ; peut-être est-ce plus facile à éviter dans le cas des pays, "Allemagne" remplaçant "allemand" le plus souvent.
Il faut un certain degré de souplesse dans la distinction des termes-matière. Un groupe de mots peut, par exemple, se diviser de telle sorte que la première partie s'associe à un terme de la classification et l'ensemble du groupe à un autre. "Aide financière" en est un exemple dans les papiers ministériels. On peut faire un renvoi synonyme ou subordonné à la version modifiée d'un terme-matière, comme dans l'exemple de "maladies du travail", où seul le second mot est traité comme un terme-matière et placé dans la classification. Quand un renvoi subordonné est ainsi introduit, il apparaît comme un sous-titre de l'entrée après les mots variables, comme dans "Travail, maladies, silicose". L'emploi de virgules pour délimiter le terme-matière dans des groupes divisibles manque malheureusement de naturel mais il faut bien exprimer la division de quelque façon.
On doit faire attention aux synonymes. "Indemnités ouvrières" n'a pas le même sens que "accident du travail", et décider de les traiter ensemble au sein des papiers ministériels, c'est risquer que les rédacteurs à venir puissent avoir à revoir toutes les références s'ils décident de les distinguer selon leur objet. Mais si, vraiment, on ne peut pas les distinguer lorsque la décision est prise pour la première fois pour les documents en question, on ne peut éluder le problème que par le dédoublement des références, et cela en vaut sans doute la peine. Les termes homonymes, qui ont plusieurs significations, doivent être marqués de façon à réclamer une décision humaine à chaque fois qu'ils se présentent. La distinction nécessaire devrait s'exprimer par le renvoi de tels termes à d'autres mots de l'index, et de tels renvois peuvent être synonymes ou subordonnés. Avant de pouvoir informatiser un index composé manuellement, on doit nécessairement l'examiner avec soin pour repérer les homonymes éventuels, faute de quoi le système pourrait accepter un terme et le classer dans un sens tout à fait impropre à l'entrée qu'il requiert et l'erreur serait alors difficile àdétecter.
Dans le contexte d'une suite d'index, il peut être souhaitable de traiter un nom, comme "Comité de défense de l'Empire" comme un terme-matière aussi. Ce sera le cas s'il est étroitement associé à une idée ou à un champ d'idées. Si tel est le cas, on doit veiller à pouvoir extraire aisément de tels noms de la classification si l'on doit l'employer pour d'autres séries documentaires, mais si l'usage de cette facilité se limite strictement à des cas d'association étroite, on ne risque pas grand'chose à ne pas faire l'extraction. Ce traitement offre une autre solution que celle qui attache des "voir aussi" aux termes de la classification et est très différent de la possibilité d'utiliser un nom comme référence à un terme-matière le suivant immédiatement dans une entrée, comme dans "Allemagne, exportation d'armements par". Dans ce dernier cas, le nom ne fait pas partie de la classification mais est seulement édité avec elle en une seule occasion. Les noms qui peuvent correctement être traités aussi comme des matières sont presque toujours ceux d'organisations et de documents.