Le dictionnaire médiéval : édition imprimée, bases électroniques

Colloque sur les bases électroniques, Université de Limoges, novembre, 1998.

Brian Merrilees
University of Toronto

Depuis plus d'une dizaine d'années nous menons un programme de recherches sur la lexicographie bilingue en France au moyen âge. Le programme, baptisé REFLEX, Research in Early French Lexicography a comme but l'édition et l'analyse des dictionnaires et glossaires bilingues, pour la plupart latins-français, compilés en France avant 1500. Notre première tâche était l'édition d'un dictionnaire latin-français qui est à notre avis un des grands atouts de la lexicographie française, le Dictionarius de Firmin Le Ver, (DLV) achevé à Abbeville le 30 avril 1440. Ce Dictionarius, dérivé du grand Catholicon de Jean Balbi de Gênes, a été édité par William Edwards et moi-même en 1994 dans la série Corpus Christianorum Continuatio Mediaevalis sous l'égide de Brepols Publishers.

Le Dictionarius de Le Ver est d'une taille impressionnante, 467 feuillets manuscrits, 1865 colonnes, un total de plus de 540,000 mots, dont à peu près un sixième en français, ce qui est devenu après la saisie électronique un texte de plus de 4Moctets. Ce Dictionarius n'est pas toutefois le seul dictionnaire ou glossaire de notre programme de recherches. Un deuxième volume est déjà en cours de publication (déc. 1998). Il contiendra un glossaire latin-français doublé d'un glossaire marginal francais-latin qui se trouve dans le ms Montpellier Faculté de Médecine H236 et un glossaire français-latin le Glossarium gallico-latinum du ms. Paris BNF lat. 7684. Le premier glossaire a été édité par Mme Anne Grondeux du CNRS, le deuxième par moi-même et Jacques Monfrin†, ancien Directeur de l'Ecole Nationale des Chartes et membre de l'Institut de France.

[Au moment de rédiger ce texte nous venons d'apprendre la mort de notre collègue et ami, Jacques Monfrin, à qui nous voulons rendre tous les hommages qui lui sont dûs. Son amitié et sa collaboration symphatiques nous ont été toujours des plus précieuses. Nous espérons trouver une autre occasion de faire l'éloge de ce grand savant].

Les deux glossaires de ce volume sont surtout importants pour le rôle qu'ils cherchent à accorder au français dans un domaine toujours dominé par le latin. L'ordre de leur lemmes français présente cependant un vrai problème car il ne sont rangés que selon leur première lettre et non pas selon une alphabétisation absolue ou établie jusqu'à la troisième ou quatrième lettre.

Nous avons également en chantier le texte du Vocabularius familiaris et compendiosus, dictionnaire incunable, imprimé à Rouen vers 1490 par Guillaume le Talleur, un des premiers imprimeurs de cette ville. Ce Vocabularius et le Glossarium gallico-latinum forme une famille avec le Dictionarius de Le Ver et leurs relations ont longtemps préoccupé mes heures de loisir. L'intérêt principal du Vocabularius par rapport au Le Ver c'est de voir quels termes sont retenus, quels termes abandonnés, et si de nouveaux termes ont été introduits. Le Dictionarius est aussi très long, plus de 600 pages imprimées et sa taille électronique est de 3,3Mo. William Edwards en sera le responsable principal.

Un quatrième texte du programme est le premier dictionnaire latin-français à dépasser la simple structure des glossaires nommés par Mario Roques l'Abavus et l'Aalma, c'est-à-dire des glossaires dont le lemme latin et son (ou ses) équivalent(s) français occupent une seule ligne d'une colonne de manuscrit, rarement plus. Il s'agit d'un texte trouvé dans le ms. Montpellier Faculté de Médecine H110 dont une variante dérivée se trouve dans le ms. Stockholm Bibl. royale N78. D'après des collègues à la Bibliothèque nationale le ms. de Montpellier pourrait dater du dernier quart du 14e siècle, p.e. même vers 1375-80. C'est donc plus ancien que le Le Ver, peut-être par une soixantaine d'années. Comme le Le Ver, sa structure est assez complexe, ayant gardé une bonne dose des articles du Catholicon et incluant aussi des lemmes et des définitions basés sur l'Elementarium doctrinae de Papias. Nous avons transcrit et saisi à peu près trois quarts de ce texte ce qui dépasse déjà 3Mo dans sa forme électronique. Nous avons la collaboration de Pierre Nobel de l'Université de la Franche-Comté et de William Edwards pour l'édition de ce texte.

Pour tous ces textes qui feront quatre volumes nous avons entrepris un engagement de publication avec Brepols Publishers de Turnhout en Belgique et le Corpus Christianorum de Bruges, la branche savante de la maison. La maison Brepols est surtout connue pour la publication textes ecclésiastiques, mais dans la communauté savante, c'est pour ses textes latins qu'elle est surtout réputée. Le Corpus Christianorum, financé par Brepols, a accepté de publier le Dictionarius de Le Ver au début des années '90 et le volume est sorti en 1994. Il n'y a aucun doute que la qualité de leur production est matériellement superbe. Pour un médiéviste l'édition critique d'un texte qui ne survit qu'en manuscrit reste un travail fondamental de la discipline, la base de toute lecture de toute analyse. Très souvent on dispose d'un seul exemplaire, parfois plus, mais dans aucun cas s'agit-il d'une disponsibilité qui pourrait rivaliser avec l'imprimé. L'édition moderne qui repose sur le manuscrit a l'avantage d'une nouvelle permanence et d'une distribution jusqu'alors impossible. Cette permanence n'est point négligeable et ce sera un des défis de la nouvelle diffusion électronique d'en garantir une permanence pareille. Le processus de l'édition est long. La transcription, même dans les circonstances les plus favorables, comme c'était le cas pour le Le Ver, ne se fait pas du jour au lendemain mais représente un travail soigneux et précis et surtout de longue haleine. Pour les cas plus difficiles tels que la transcription des manuscrits de Montpellier et de Stockholm, dont les deux scribes n'étaient point experts en latin, l'établissement d'un texte compréhensible reste un vrai défi. Les deux copies - il s'agit plutôt de deux versions - de ce dictionnaire sont loin d'être parfaites et même en les montrant côte à côte, il faut avoir recours aux textes-sources comme le Catholicon de Balbi et l'Elementarium de Papias pour arriver parfois à une compréhension satisfaisante. Si ce genre de travail représente une perspective alléchante pour le vrai philologue, tel le M. Procuste dont Bernard Cerquiglini nous parle dans son Eloge de la variante, ce n'est pas nécessairement le cas pour des chercheurs voulant y puiser des matériaux pour d'autres fins.

J'ai souvent l'habitude de dire que l'éditeur de textes travaille dans les tranchées pour les archéologues du savoir.

Echantillon du Dictionarius de Firmin Le Ver

MACHIA - grece, latine dicitur pugna, unde
Machina, machine - .i. omne quod ingenio paratur
ad pugnam ut balista et similia et manganum,
licet et quelibet artificiosa constructio dicatur quandoque
machina .i. abalestre, mangonniau, perriere
ou aultres engins pour bataille ou bolevert, unde
Machinor .naris .natus sum vel fui, machinari d
- .i. machinas facere vel parare, co<n>struere .i.
faire et appareillier telz instrumens de guerre
Machinari eciam dicitur cogitare et proprie malum .i. d
penser mal vel astute insidiari, moliri
Machinatus .a .um - nomen et participium - machinés, pensés
Machinatio .tionis - machinemens en mal
Machinamen .minis - idem, molimen, cogitatio in malum vel insidie
Machinamentum .menti - idem
Machinor .naris componitur Commachinor .naris
MACHINIS, huius machinis - a *machina dicitur f
Machines sunt instrumenta edificiorum, dicta
sic a machinis quibus insistunt propter altitudinem
parietum .i. eschafaus pour faire edefiches
MACHINOSUS - a *machina, machine dicitur
Machinosus .sa .sum - .i. plenus machinis
vel ingeniosus ad machinas faciendas
vel insidiosus, quia machina sepe invenitur
pro insidiis et comparatur
Machinose - adverbium - .i. insidiose et comparatur
Machinositas .tatis - .i. insidiositas
MACHINULA .le - diminutivum - parva machina, idem est
MACIA, maciorum - pluraliter - .i. intestina, scilicet que n
sordes eliciunt .i. boiaux et dicitur a *macies
MACILENTUS .a .um - maigres macie plenus - In ¶Macer dicitur
Macilento .tas .tatum - .i. macilentum facere act
maigrir, faire maigres et Macilentatus .ta .tum
MACOR, macoris - maigresse - In ¶Macer dicitur
MACREDO .dinis - macies maigresse - In Macer dicitur
Macritudo .tudinis - idem - eciam in ¶Macer dicitur

Vous verrez dans cet échantillon la complexité de la structure du texte, aspect qui nous a longtemps intéressé. Cette structure a été analysée dans plusieurs de nos publications car Le Ver a combiné peut-être plus intelligemment qu'aucun autre lexicographe médiéval les deux processus principaux qui fournissent l'accessibilité et la consultabilité aux textes lexicographiques du moyen âge, l'alphabétisation et la dérivation.
L'unité de base est le macro-article, construit d'une lemme qui suit un ordre alphabétique absolu, et une série de lemmes dérivés, des sous-lemmes ou sous-entrées, dont l'ordre suit un patron hiérarchique. En fait la structure arborescente de ces macro-articles laisse suggérer que Le Ver avait un esprit qui se serait facilement prêté à l'esprit informatique.

Toutefois nous savons que l'accessibilité et la consultabilité, déjà accrues par la seule édition, restent élémentaires et que la manipulation des éléments de l'imprimé a certainement ses limites. Les glossaires, les index, tout l'apparat critique offrent au chercheur une richesse de témoignages philologiques, lexicologiques, et textuels. Ils ne fournissent pas cependant la possibilité d'explorer le texte non-lemmatique, de le sonder et de l'interroger dans toutes ses profondeurs. Il faut pouvoir demander à ce texte de nous livrer toutes ses richesses. La réponse est évidente. Il faut à l'époque actuelle trouver des moyens électroniques pour nous aider.

WordCruncher

Dès le début de notre entreprise nos textes transcrits ont été saisis tout en WordPerfect, d'abord dans la version 4.1 jusqu'à la version 8. Dès le début aussi nous avons converti chaque texte, chaque portion de texte même, au format de WordCruncher, logiciel simple à exploiter, mais très efficace pour nos besoins. WordCruncher fournit une concordance interactive que nous avons utilisée tout le long de notre travail comme instrument de vérification ainsi que d'outil d'analyse. A travers les années nous avons ajouté les dictionnaires et les glossaires que nous avons mentionnés plus haut ainsi que d'autres textes au point où nous avons aujourd'hui un vrai trésor de la langue lexicographique du moyen âge français dont la taille dépasse 14Mo. Une grande partie de ce trésor est bien sûr en latin. WordCruncher a certaines limites mais pour le travail que nous entreprenons ce logiciel continue à être parfaitement adapté à nos besoins d'éditeur et d'historien de la langue. Le logiciel a trois niveaux de représentation, tout à fait biblique dans sa structure - livre/chapitre/verset. Un premier écran présente une liste des termes recueillis des textes, un deuxième permet de voir le contexte immédiat dans une fenêtre de trois lignes (ces fenêtres peuvent être ajustées) et le troisième écran en donne le contexte élargi qui est en effet le texte entier. L'architecture de ce logiciel, créé dans le format DOS, reste toujours étonnante dans sa simplicité et elle est d'une rapidité éblouissante. Par contre, la version Windows, toujours semble-t-il en chantier, n'a pas réussi à donner des résultats pareils.

Le trésor REFLEX

Notre trésor contient les textes lexicographiques suivants (l'astérisque indique que le texte entier a été saisi):
Dictionarius de Firmin Le Ver*, Abbeville (1444)
Vocabularius familiaris et compendiosus, Guillaume Le Talleur, imprimeur à Rouen (c.1490*)
Montpellier, Faculté de Médecine, 236, adaptation de Brito*
Glossarium gallico-latinum (1430-1450?)*
Anger, Bibl. mun., 497-498 (15e s.)
Montpellier, Faculté de Médecine, H110 (c. 1380?)
Stockholm, Bibl. royale, N78 (15e s.)
Aalma
Paris, BNF lat.13032*
Metz, Bibl. mun.1182*
Metz, Bibl. mun. 510
Lille, Bibl. mun., 147*
Salins, Bibl. mun. 44
Abavus
Douai,
Evreux 23
Vatican 2748
Paris BNF lat.7692]

CETEDOC

Depuis plusieurs années Brepols Publishers ont une entente avec le groupe CETEDOC de l'Université de Louvain-la-Neuve pour créer les index aux textes latins qu'ils publient. Leur produit principal, l'index des textes latins chrétiens, le CLCLT = Cetedoc Library of Christian Latin Texts, est d'une réputation mondiale. Selon Brepols nous aurions dû avoir des index du Dictionarius sur micro-fiches peu après la publication de l'édition, mais maintes contraintes semblent avoir retardé ce projet et au moment de la rédaction de ce notice (déc. 1998) les index ne sont pas sortis. De toute façon quand les index paraîtront, ils seront en format CD-rom.

Projet Internet

Pour nos dictionnaires en chantier, nous avons pris une première initiative pour faire connaître notre travail d'édition sur l'Internet. Nous avons tout simplement pris la lettre A de quatre projets pour les afficher sur notre site personnel:

http://www.chass.utoronto.ca:8080/~ merrilee/reflex.htm

Ces échantillons ne sont pas pourvus d'engins de recherche mais les outils de Netscape etc. permettent au moins de répérer des termes individuels. L'objet de l'exercice est plutôt de fournir des textes pour que l'on prenne note de leur forme et d'une partie de leur contenu. Néanmoins, avec l'encouragement de Russ Wooldridge, j'espère commencer bientôt un projet internet qui aura l'avantage d'être pour notre équipe un projet pilote et qui mettra en forme électronique un des premiers glossaires latins-français. Il s'agit d 'un des textes de notre liste, l'Aalma, ainsi dénommée par son éditeur Mario Roques d'après le premier lemme: "Aalma - vierge secrete ou sainte". Roques a signalé douze versions de l'Aalma dont celle qu'il a publiée en 1938, Paris, BNF lat. 13032. Mme Jean Shaw (Ph.D. Université de Toronto 1997)

http://www.chass.utoronto.ca:8080/~ wulfric/edicta/shaw/

en a trouvé deux autres et la mention d'une troisième que Roques a surement décidé de ne pas citer, une version des Archives nationales et disparue depuis longtemps. Mlle Hélène Naïs avait annoncé en 1986 l'intention d'informatiser ces textes mais, selon les renseignements que nous avons eus, on ne dispose pas de versions informatisées. Ce que nous espérons entreprendre dans un avenir proche c'est la publication électronique de plusieurs versions de cette Aalma.

Les extraits suivants tirés de trois versions de l'Aalma permet d'examiner les différences que l'on peut y trouver:

Paris, BNF lat. 13032
Materia, materie - longues parois de quoy vignes ou autres choses sont closes, c'est maisiere - f
Macerio .onis - constructor maceriarum - m
Macero .ras .ravi .rare - combrisier, dilanier, despecier, debiliter, mollifier - a
Machera .re - long glaives d'une part agus - f
Machie - grece, pugna latine
Machina .ne - engin a gitter ou espices - f
Machinis, huius machinis (86ra) - engin a faire edifices
Machinor .naris .natus sum .nari - faire machines, engins ou penser mal ou cauteleusement espier - d
Machinosus .sa .sum - plein de machines - o
Machinula .le - petite machine - f

Metz, Bibl. mun., 1182
Materia .rie - longs murs de quoy vignes ou jardins ou autres choses sont closes
Macerio .onis - constructeur
Macero .as .avi .are - combriser, depecier, debilliter
Machera .re - grant coustiau qui est agu d'une part
Machia - grece, pugna latine
Machina .ne vel machins, huius machinis - engin a tirer pierres adifier - versus:
Aude sic dici plus machina quamvis (78ra)
Machinor .aris .natus .ari - c'est machiner aucun mal contre aultruy ou le epier - deponens
Machinosus .sa .sum - plain d'angin
Machinula .le - petite machine

Lille, Bibl. mun. 147 (anc. 388)
Maceria .e - longue parois de pierres as vignes -f
Maceries .ei - idem - f
Macerio .onis - qui fait parois - m (<221r>)
Macero .ras .ravi .rare - combrisier, dilanier, despecier, debiliter, mollifier - a
Macera .re - longue lame paragüe -f
Macia - grece, pugna latine
Machina .e - engin, espice, edificez - f
Machinus .ni - engin a faire edifices - m
Machinor .aris - faire engin, edefices ou penser mal ou espiier ou cautuleusement penser - de
Machinosus .a .um - plain de machinations ou de deceptions - o
Machinula .e - diminutivum de *machina

Ce sera tout d'abord la version de Paris BNF lat. 13032 que nous convertirons en format TACTWEB.

(Voir l'échantillon html de la lettre A: http://www.chass.utoronto.ca:8080/~ merrilee/aalma.htm)

Cette opération devrait nous permettre de passer plus vite aux autres versions pour fournir une série comparative de textes qui représentent un des plus importants glossaires bilingues du français médiéval.