11.1 Noms et chaînes de caractère de référence

       

Une « chaîne de référence » (referring string) est une expression qui se réfère à une personne, un endroit, un objet donné, etc. Deux éléments sont fournis pour marquer de telles chaînes :

<rs>
  contient une chaîne de référence ou un nom général ; parmi les attributs possibles, citons :
<type>
 

indique plus spécifiquement l'objet auquel la chaîne se réfère. Des exemples de valeurs sont : personne , endroit , navire , élément , etc.

<name>
  contient un nom propre ou une proposition substantive ; parmi les attributs possibles, citons :

<type>
 

indique le type d'objet qui est nommé par l'expression.

L'attribut type est employé pour distinguer (par exemple) entre des noms de personnes, d'endroits ou d'organisations, dans les cas où cela est possible :

 <q>My dear <rs type=person>Mr. Bennet</rs>, </q>
 said his lady to him one day, <q>have you heard
 that <rs type=place>Netherfield Park</rs> is let
 at last?</q>
 
 It being one of the principles of the
 <rs type=organization>Circumlocution Office</rs> never,
 on any account whatsoever, to give a straightforward answer,
 <rs type=person>Mr Barnacle</rs> said, <q>Possibly.</q>

Comme le montrent les exemples suivants, l'élément <rs> peut être employé pour toute référence à une personne, un endroit, etc., qui n'est pas forcément un nom propre ou une proposition substantive :

 <q>My dear <rs type=person>Mr. Bennet</rs>,</q>
 said <rs type=person>his lady</rs> to him
 one day...

 <q>Peu après son installation <rs type=lieu>rue Simon-
 Crubelier</rs>, <rs type=personne>Maurice Réol</rs>, qui
 était <rs type=metier>aide-rédacteur</rs> à la
 <rs type=organisation>CAMPA</rs> ...

L'élément <name>, au contraire, est prévu pour le cas spécial des chaînes de référence contenant uniquement des noms propres ; il peut être utilisé de la même façon que l'élément <rs>, ou imbriqué au sein de celui-ci si une chaîne de référence contient un mélange de noms communs et de noms propres.

Le simple fait de baliser un objet en tant que « nom » ne suffit généralement pas pour permettre le traitement automatique des noms de personnes afin d'obtenir les formes canoniques généralement requises à des fins de référence. Un nom tel qu'il apparaît dans le texte peut être orthographié de façon incohérente, ou être partiel ou flou. Qui plus est, des particules de noms tel que van ou de la peuvent ou non être incluses dans la forme de référence d'un nom. Ceci dépend de la langue et du pays de celui qui porte le nom en question.

Les attributs suivants sont également disponibles pour ces éléments et pour des éléments similaires, afin de surmonter ces difficultés :

<key>
 

fournit un autre identifiant pour l'objet nommé, telle qu'une clé d'un enregistrement de base de données ;

<reg>
  donne une forme régularisée ou normalisée du nom utilisé.

L'attribut key peut être un moyen utile pour rassembler toutes les références se rapportant à la même personne ou au même emplacement éparpillés à travers un document :

    
 <q>My dear <rs type=person key=BENM1>Mr. Bennet</rs>,
   </q> said <rs type=person key=BENM2>his lady</rs>
   to him one day, <q>have you heard that
   <rs type=place key=NETP1>Netherfield Park</rs>
   is let at last?</q>

Cette utilisation devrait être distinguée du cas de l'attribut reg (régularisation), qui permet de marquer la forme standard d'une chaîne de référence, comme ci-dessous :

 <name type=person key=WADLM1 reg='de la Mare, Walter'>
      Walter de la Mare
   </name>
   was born at
   <name key=Ch1 type=place>Charlton</name>, in
   <name key=KT1 type=county>Kent</name>, in 1873.

On peut aussi baliser de façon plus détaillée les composants de noms propres, en utilisant le jeu de balises supplémentaires traitant les noms et les dates.



Association GUTenberg - BP 10, 93220 Gagny principal   - Tél. et Fax (33) 01 30 87 06 25
e-mail : gut@irisa.fr   et   tresorerie.gutenberg@ens.fr