Présentation du programme

Cette notice est la mise à jour de la présentation du programme qui se trouve dans :

G.M. ROCCATI, A propos de la scansion automatisée des mètres latins: un programme spécialement conçu pour les textes médiévaux et humanistes, in "Revue. Informatique et Statistique dans les Sciences Humaines (C.I.P.L.-L.A.S.L.A.)", t. XXVI (1990), pp. 221-231.

A. Nature et buts du programme – Le programme a un caractère essentiellement pragmatique. Il n’entend pas fournir un traitement complètement automatique, mais un instrument capable d’exécuter les tâches répétitives qui peuvent être formalisées dans le travail de scansion, ce qui permet de disposer de manière relativement rapide d’un « matériau » de travail qui peut être important : vers scandés, tables des formes métriques, index des termes avec indication des quantités prosodiques. Ce matériau de base est enregistré dans des fichiers lisibles par traitement de texte et dans des bases de données au format Microsoft Excel. En outre, pour réduire au minimum le travail manuel, le programme est conçu pour traiter presque directement un texte non préparé. Seules contraintes : en ce qui concerne la graphie, la normalisation u/v selon l'usage moderne est nécessaire ; l'enregistrement doit être en clair, en caractères ASCII, sans codes, c’est-à-dire en format « txt », en caractères non proportionnels (p. ex. Courier). Ne doivent pas non plus apparaître à l'intérieur du texte des renvois aux notes ou autres signes hétérogènes par rapport à la ligne à scander. Il faut donc, le cas échéant, éliminer préalablement les titres, lignes blanches, rubriques, indications de feuillets, etc. Le programme ne pourrait pas les reconnaître et échouerait évidemment dans sa tentative de traitement. En revanche sont admis dans le texte les signes de ponctuation, les tabulations, les blancs ou la numérotation des vers (à condition qu'ils se trouvent au début des vers). Il est donc possible, par exemple, d'utiliser directement, ou presque, le texte enregistré d'une édition.

Le programme se veut flexible, pour permettre de résoudre en cours de traitement les éventuels problèmes nouveaux qui pourraient se poser. C'est pourquoi le traitement est organisé en phases successives. Il est possible après chaque phase de parcourir à l’écran, et d'imprimer pour vérification, les résultats provisoires obtenus, de même qu’il est possible à chaque fois de recommencer le traitement à partir de l'une quelconque des phases déjà exécutées une fois introduites dans les textes traités les modifications ou les corrections qui se seraient révélées nécessaires. Les modifications peuvent être introduites soit dans le texte lui-même (pour corriger une erreur d'entrée, par exemple), soit dans la scansion proposée par la machine dans les cas où, pour une raison quelconque (texte dont le traitement est impossible ou erroné, licence poétique ou exception prosodique), la procédure ne peut fournir une scansion satisfaisante.

B. Phases du traitement – La scansion des textes se fait par une série de procédures automatiques ou semi-automatiques, en appliquant un nombre limité de règles, conçues comme des hypothèses de travail, vérifiées lorsqu'elles permettent la scansion. Les phases successives dans lesquelles le traitement s'articule sont regroupées sous les menus suivants : 1. Général; 2. Opérations de base; 3. Scansion; 4. Classement des formes métriques; 5. Thesaurus lexical; 6. Procédures obsolètes; 7. Césure (hexamètre).

B.1 Première phase – La première phase (2.1 : le premier chiffre renvoie au menu, le deuxième à la procédure,) enregistre sous forme normalisée le texte à traiter et calcule les quantités de base, indépendamment du type de vers que l'on veut scander. Le calcul des quantités de base est exécuté par la création de séquences de caractères, invisibles pour l'utilisateur, reproduisant en forme normalisée, en majuscules sans ponctuation et en chiffres, le vers à scander. A chaque syllabe est attribuée une quantité: 0 = indéterminée, 1 = brève, 2 = longue. Les règles classiques sont appliquées, mais dans une forme simplifiée au maximum.

Les éléments suivants sont identifiés et la quantité attribuée:

a. diphtongues (oe, ae, au);

b. u et i semiconsonne (qu, gu, i/j);

c. h intervocalique;

d. brèves (voyelle suivie de voyelle) et longues (syllabe fermée) par position;

e. monosyllabes se terminant en voyelle, toujours longs;

f. u final, toujours long.

Un certain nombre de séquences particulières, dont la scansion serait aberrante si on appliquait mécaniquement ces règles, ont été enregistrées dans une table lors de la phase 2.1; la procédure consulte cette table et, avant tout autre calcul, introduit les quantités mémorisées.

Élision et hiatus sont également calculés. Sous la désignation d’« élision », il faut en fait entendre ici toute élimination de syllabe entre deux mots dans la scansion. Les règles latines ont été radicalement simplifiées: devant un début de mot vocalique, voyelle finale et syllabe finale se terminant en m sont toujours supprimées dans le décompte des quantités: cela revient à assimiler à l’élision des phénomènes tels que la synalèphe et l’aphérèse, bien différents dans la métrique classique. A la demande, le programme calcule aussi l'élision en dernière position pour le vers hypermètre. Si dans le vers il est possible d'élider un ou plusieurs mots, le programme crée autant de vers qu'il le faut pour réaliser les différentes possibilités: deux vers (2¹) pour une élision, quatre (2²) pour deux, huit (2³) pour trois, et ainsi de suite :

Josephina, 2^a distinctio (incipit: Membra), v. 129:

trois élisions possibles, donc huit vers

(résultat après phases 2.1 et 3.1.1)

Membra / 129 / 1