10 Omissions, effacements et ajouts

      Outre la correction ou la normalisation des mots et des expressions, les rédacteurs et les transcripteurs peuvent aussi ajouter du texte dans des passages lacunaires, ôter du texte, ou encore transcrire du texte effacé ou biffé dans l'original. En outre, un texte donné peut être particulièrement difficile à transcrire car difficile à déchiffrer dans la page. Les éléments suivants peuvent être employés pour enregistrer de tels phénomènes :

<add>
 

contient des lettres, mots ou expressions insérés dans le texte par un auteur, scribe, annotateur ou correcteur ; parmi les attributs possibles, citons :

<place>
 

si l'ajout est écrit dans la copie, il indique l'emplacement du texte supplémentaire. Des exemples de valeurs possibles sont inline  (sur la ligne), supralinear  (au dessus de la ligne), infralinear  (sous la ligne), left  (dans la marge gauche), right  (dans la marge droite), top  (au dessus), bottom  (en dessous), etc.

<gap>
    

indique un endroit où du texte a été omis dans une transcription, que ce soit pour des raisons éditoriales décrites dans l'en-tête TEI, (dans la section décrivant les principes de sélection), ou parce que l'original est illisible ou inaudible ; parmi les attributs possibles, citons :

<desc>
 

donne une description du texte omis ;

<resp>
 

indique l'éditeur scientifique, le transcripteur ou l'encodeur ayant pris la décision de ne pas fournir une transcription du texte, d'où l'application de la balise <gap>.

<del>
  contient une lettre, un mot ou un passage effacé, marqué comme effacé, sinon indiqué comme étant superflu ou erroné dans la copie par un auteur, scribe, annotateur ou correcteur ; parmi les attributs possibles, citons :

<type>
  classe le type d'effacement selon une typologie appropriée ;

<status>
  peut être employé pour indiquer des effacements erronés, par exemple des raturages comportant trop de texte ou pas assez de texte ;
<hand>
 

désigne la main de l'agent qui a effectué l'effacement.

<unclear>
  contient un mot, une expression ou un passage qui ne peut pas être transcrit avec certitude parce qu'il est illisible ou inaudible dans la source ; parmi les attributs possibles, citons :

<reason>
  indique la raison pour laquelle le passage est difficile à transcrire ;

<resp>
 

indique la personne responsable de la transcription de la lettre, du mot ou du passage contenu dans l'élément <unclear>.

Ces éléments peuvent être employés pour enregistrer des changements effectués par un éditeur, par le transcripteur ou (dans la source manuscrite) par l'auteur ou le scribe. Par exemple, si la source d'un texte électronique est :

Les éléments suivants sont proposés pour
pour noter des interventions du transcripteur.
alors il pourrait être souhaitable de corriger l'erreur évidente, tout en enregistrant l'effacement du deuxième pour superflu, ainsi :

Les éléments suivants sont proposés pour
<del hand=LB>pour</del> noter des interventions du transcripteur.

La valeur d'attribut LB sur l'attribut hand indique que « LB » a corrigé la duplication du mot pour.

Si la source était :

Les éléments suivants proposés pour
pour noter des interventions du transcripteur.

(si le verbe avait été oublié par inadvertance), alors le texte lui-même pourrait se lire :

    
 Les éléments suivants <add hand=LB>sont</add> proposés pour
 <del hand=LB>pour</del> noter des interventions du transcripteur.

Ces éléments ne sont pas limités aux changements faits par un éditeur; ils peuvent aussi être employés pour enregistrer des changements dus à l'auteur dans des manuscrits. Un manuscrit (cité par Almuth Grésillon, Éléments de critique génétique, PUF, 1994 p. 132--133) dans lequel Proust a d'abord écrit « Bientôt la lumière sous la porte s'éteint et il retombe dans l'obscurité. » puis biffé « il retombe » et inséré en-dessous « tout rentre » pourrait être codé ainsi :

 
 Bientôt la lumière sous la porte s'éteint et
  <del hand=PROUST type=overstrike>il retombe</del>
 <add hand=PROUST place=infralinear> tout rentre</add> 
 dans l'obscurité.

De la même manière, les éléments <unclear> et <gap> peuvent être employés ensemble pour indiquer l'omission d'un passage illisible ; l'exemple suivant montre aussi l'emploi de <add> pour une correction conjecturale :

 One hundred & twenty good regulars joined to me
 <unclear><gap reason='indecipherable'></unclear>
 & instantly, would aid me signally <add hand=ed>in?</add>
 an enterprise against Wilmington.

L'élément <del> identifie les passage qui sont transcrits dans le texte électronique bien qu'ils soient marqués comme étant effacés, tandis que <gap> marque l'emplacement d'un passage qui est omis du texte électronique, qu'il soit lisible ou non. Un corpus contenant des passages en plusieurs langues, par exemple, pourrait omettre des citations longues dans des langues étrangères :

    
 <p> ... An example of a list appearing in a fief ledger of
 <name type=place>Koldinghus</name> <date>1611/12</date>
 is given below. It shows cash income from a sale of
 honey.</p>
 <q><gap desc='quotation from ledger'
     reason='in Danish'></q>
 <p>A description of the overall structure of the account is
 once again ... </p>

D'autres corpus (notamment ceux qui ont été créés avant l'emploi généralisé du lecteur optique) omettent systématiquement les schémas et les parties mathématiques :

 <p>En avant du puzzle ...
  Un des classeurs est ouvert sur une page en partie 
  couverte d'équations transcrites d'une écriture 
  fine et serrée:
  <gap desc='demonstration morphisme' reason='maths'> 
 </p>



Association GUTenberg - BP 10, 93220 Gagny principal   - Tél. et Fax (33) 01 30 87 06 25
e-mail : gut@irisa.fr   et   tresorerie.gutenberg@ens.fr