4.1 Eléments servant à marquer les divisions de texte

    

Le corps d'un texte en prose peut avoir la forme d'une simple suite de paragraphes ; les paragraphes peuvent également être regroupés en chapitres, sections, subdivisions, etc. Dans le premier cas, chaque paragraphe est balisé au moyen de <p>. Dans le second cas, l'élément <body> peut être divisé soit en une série d'éléments <div1>, soit en une série d'éléments <div>, l'un ou l'autre pouvant se voir subdivisé à son tour, comme nous le verrons ci-dessous :

<p>
  marque les paragraphes écrits en texte courant ;  
<div>
  contient une subdivision des pièces liminaires, du corps, ou des annexes d'un texte ;
<div1>
 

regroupe une subdivision de premier niveau des pièces liminaires, du corps, ou des annexes d'un texte (la plus grande si <div0> n'est pas employée, sinon la seconde en ordre de grandeur).

Lorsque des subdivisions structurales plus petites que <div1> sont nécessaires, un <div1> peut être divisé en éléments <div2>, et un <div2> en éléments encore plus petits <div3>, etc., jusqu'au niveau <div7>. En présence de plus de sept niveaux de division structurale, il sera nécessaire soit de modifier l'ensemble du balisage TEI pour lui permettre d'accepter <div8>, etc., soit d'employer un élément <div> non numéroté : un <div> peut être subdivisé en de plus petits éléments <div> (le niveau d'imbrication n'est pas limité).

Tous ces éléments sont dotés des trois attributs suivants :

<type>
  indique le nom conventionnel pour cette catégorie de division de texte. Typiquement, sa valeur sera livre , chapitre , poème , etc. D'autres valeurs sont possibles : roupe  pour des groupes de poèmes, etc. traités comme une seule unité, ou bien sonnet , speech , et song . À noter que toute valeur fournie pour l'attribut type du premier <div>, <div1>, <div2>, etc. dans un texte est supposée s'appliquer pour tous les < div>, <div1> <divn> ultérieurs dans le même <body>. Cela implique qu'une valeur doit être donnée pour le premier élément de division de chaque type, ou lors de tout changement de valeur.

<id>
  spécifie un identifiant unique, spécifique à cette division, qui servira dans le cas des références croisées ou d'autres liens pointant vers cette division (par exemple un commentaire) comme c'est expliqué de façon plus détaillée en Liens et références croisées. Il est souvent utile de fournir un attribut id pour chaque unité structurale majeure d'un texte et de déterminer les valeurs de l'identifiant de façon systématique, par exemple en accolant un numéro de section à un court libellé rappelant le titre de l' uvre en question, comme ceci est montré dans les exemples suivants.

<n>
  indique un nom court mnémonique ou un numéro pour la division, qui serviront à l'identifier de préférence à l'attribut id. S'il existe déjà une forme conventionnelle de référence ou d'abréviation pour les parties d'un ouvrage existant (tel que le modèle « livre / chapitre / vers » pour les citations bibliques), ladite forme sera enregistrée dans l'attribut n .

Les attributs id et n, sont de fait d'un intérêt si général qu'ils sont permis sur tout élément dans n'importe quelle DTD de la TEI : ce sont des attributs globaux. D'autres exemples d'attributs globaux définis dans les recommandations TEI Lite sont présentés en Attributs de liaison.

La valeur de chaque attribut id doit être unique au sein d'un document. Il existe une façon simple de s'assurer que ceci est bien le cas : faire en sorte que la valeur de l'attribut reflète la structure hiérarchique du document.

À titre d'exemple, l'ouvrage Wealth of Nations de Smith contenait dans sa première édition cinq tomes, chacun étant partagé en chapitres, certains chapitres étant eux mêmes subdivisés en parties. Nous pouvons définir les valeurs de l'attribut id pour cette structure comme suit :

 <div1 id=WN1 n='I' type='book'>
   <div2 id=WN101 n='I.1' type='chapter'>
    ... 
   </div2>
   <div2 id=WN102 n='I.2' type='chapter'>
    ... 
   </div2>
    ...
   <div2 id=WN110 n='I.10' type='chapter'>
      <div3 id=WN1101 n='I.10.1' type=part>
       ... 
      </div3>
      <div3 id=WN1102 n='I.10.2' type=part>
       ... 
      </div3>
   </div2>
   ...
 </div1>
 <div1 id=WN2 n='II' type='book'>
    ....
 </div1>
 ...

Pour prendre un exemple français, les Mémoires d'outre-tombe de Chateaubriand sont divisées en parties, ces dernières étant elles mêmes subdivisées en livres et en chapitres. Nous pouvons définir les valeurs de l'attribut id pour cette structure comme suit :

 <div1 id=MOT1 n='I' type='partie'>
   <div2 id=MOT11 n='I.l' type='livre'>
    ...
   </div2>
     <div3 id=MOT111 n='I.1.1  type='chapitre'>
       ...
   </div3>
  <div2 id=MOT1 n='I.2' type='livre'>
   ...
  </div2>
   .....
  <div2 id=MOT1l0 n='I.10' type='livre'>
    <div 3 id=MOT1101 n='I.10.1' type=chapitre>
      ...
    </div3>
    <div3 id=MOT1102 n='I.10.2  type=chapitre>
      ...
    </div3>
    </div2>
   ....
 </div1> 
 <div1 id=MOT2 n='II' type='partie'>
   ....
 </div1>
 .....

Les attributs id et n peuvent être traités au moyen d'un système de numérotation différent :   ceci est souvent utile lorsqu'un schéma canonique de référence est employé mais que ce dernier ne concorde pas avec la structure de l' uvre. Par exemple, dans un roman partagé en livres, chacun contenant des chapitres, ces derniers étant numérotés séquentiellement dans la totalité de l' uvre plutôt qu'à l'intérieur de chaque livre, on pourrait employer une représentation proche de ce qui suit :

  <div1 id=TS01 n='1' type='Volume'>
    <div2 id=TS011 n='1' type='Chapter'>
       ...
    <div2 id=TS012 n='2'>
       ...
 </div1>
 <div1 id=TS02 n='2' type='Volume'>
    <div2 id=TS021 n='3'type='Chapter'>
       ...
    <div2 id=TS022 n='4'>
       ...
 </div1>

Dans cet exemple, l' uvre comporte deux volumes, chacun contenant deux chapitres. Les chapitres sont numérotés conventionnellement de 1 à 4, mais les valeurs spécifiées pour l'attribut id leur permettent d'être considérés comme s'ils étaient également numérotés par 1.1, 1.2, 2.1, 2.2.



Association GUTenberg - BP 10, 93220 Gagny principal   - Tél. et Fax (33) 01 30 87 06 25
e-mail : gut@irisa.fr   et   tresorerie.gutenberg@ens.fr