Groupe : « Publications »
Cet article traite de la localisation de TeX en Hongrie, au présent et au futur. Les auteurs passent en revue les outils nécessaires à la préparation de documents en hongrois et en particulier les améliorations nécessaires pour que TeX soit davantage prêt à l’emploi en Hongrie. Une partie du travail a déjà été accomplie et une courte liste présente les travaux projetés dans un futur proche. Les problèmes résultant des spécificités de la langue hongroise (par exemple la coupure des mots, le traitement des articles définis et des suffixes) sont abordés, ainsi que les tâches induites par la tradition typographique hongroise (par exemple la mise en page).
Cet article est la traduction en français de On the Localization of TeX in Hungary. Ce texte est paru dans les actes de la conférence TUG 2002, qui s’est tenue à Trivandrum (Inde) en septembre 2002.
Traduction de Jean-Michel Hufflen.
Cet article décrit une extension de BibTEX dans le cadre du multilinguisme et les étapes prévues pour sa réalisation. Nous montrons comment nous tentons de satisfaire à la fois les auteurs souhaitant que la langue utilisée pour la bibliographie d’un ouvrage soit celle de l’ouvrage et ceux qui préfèrent que la langue utilisée pour décrire chaque référence soit celle de la référence elle-même. L’outil que nous réalisons sera adaptable à tout paquetage multilingue de LaTeX 2ε ; et nos conventions assurent une compatibilité aussi bien avec les fichiers bibliographiques .bib existants qu’avec les fichiers de style .bst existants.
This paper describes a multilingual extension to BibTEX, and the steps of its implementation. We meet the requirements of users who wish the language used for the bibliographical references of a printed work to be the work’s language, as well as users who prefer the language of each reference to be the reference’s. Our tool will be able to work with any multilingual package of LaTeX 2ε. Besides, our extension allows both existing bibliographical files (.bib files) and bibliography style files (.bst files) to be processed compatibly.
Nous présentons un modèle abstrait de représentation de terminologies multilingues informatisées en XML défini dans le cadre du comité technique 37 de l’ISO. Il repose sur une méthodologie qui distingue la structure générale d’une base terminologique et les informations (catégories de donnée) qui servent à décrire les différents niveaux de cette structure.
We are introducing an abstract model for representing computerized multilingual terminologies. This model has been developped in XML by Technical Committee 37 of ISO. It relies on a methodology which makes an essential distinction between the general structure of a terminological database and the information units (data categories) that are used to describe the various levels of this structure.
Alors qu’Ω ne cesse d’évoluer et ses fonctionnalités de se diversifier et de s’élargir, on s’aperçoit que les méthodes utilisées pour permettre la composition des langues orientales peuvent aussi servir à résoudre des problèmes jusqu’alors négligés des langues occidentales. Les mêmes types d’outils servent à segmenter les propositions thaï en mots puis en syllabes et serviront aussi à déterminer si une lettre « s » d’un mot allemand écrit en gothique doit être longue ou courte... Dans ces deux cas l’outil en question est un analyseur morphologique, outil d’une discipline connue sous le nom de traitement automatique des langues (TAL en français, NLP = Natural Language Processing en anglais). Grâce au mécanisme d’OTP externe (OTP = Ω Translation Process) d’Ω, nous pouvons intégrer ces outils dans Ω et les utiliser en temps réel pendant la composition. Comme tout ce qui a trait aux langues dites naturelles, ces outils ne peuvent être fiables à 100 % ; ils imposent donc relecture et inspection du texte composé : Ω peut, par le biais de méthodes de colorisation ou de marquage visuel, faciliter et optimiser cette relecture, en paliant ainsi les défauts d’application des outils linguistiques.
Dans cet article nous allons étudier six cas d’utilisation d’outils ou de méthodes linguistiques, de complexité très variée et couvrant un spectre de langues assez étendu : l’anglais, l’allemand, le grec, l’arabe, le thaï et le japonais. Dans chaque cas il s’agira d’introduire certaines informations supplémentaires concernant la structure syntaxique ou morphologique du texte ou sa phonologie ; ces informations peuvent évidemment être saisies par un auteur méticuleux et patient en même temps que le texte-même : un hypothétique auteur allemand peut marquer explicitement les « s » longs et les « s » courts, un auteur thaï peut, en théorie, indiquer les limites des mots et des syllabes. Mais cela devient vite pénible et ne devrait donc pas faire partie de la tâche de l’auteur mais plutôt de celle de l’imprimeur, voire dans certains cas de celle du correcteur ou du responsable éditorial.