= Accueil = Enjeux et objectifs 4 Balisage XML
± Initiation à XML
± Comment baliser ? ± Normes de balisage ± DTD ± Feuilles de style ± Corpus textuels ± Corpus lexicaux = Encodage Unicode = Communications = Mauvais affichage ? |
Le balisage XMLInitiation à XMLLe cours d'Andrei Popescu-Belis (ETI, Université de Genève) Intro (Université de Montréal) Aspects informatiques des bases documentaires hétérogènes et réparties (Université de Caen) Comment baliser un texte ?Trucs et astucesConvertir des corpus téléchargés sur Internet (Centre Termisti) Fiches cuisine et équipement de survie pour corpus (revue Texto) Logiciels utilisés
Le consortium de la Text Encoding Initiative propose une solution permettant d'ouvrir un fichier XML dans le traitement de texte d'Open Office et, inversement, de sauvegarder un fichier traitement de texte au format XML de la TEI (mode d'emploi). L'expérimentation montre la viabilité de cette solution. Pour l'importation d'un fichier TEI dans Open Office, les fichiers proposés ne permettent pas d'aller au-delà de la simple démonstration (cf. exemple en wolof). Toutefois, il semble tout à fait possible de les améliorer en veillant à une plus grande diversification des éléments présents dans la DTD et des styles qui leur correspondent dans le modèle tei.stw. Cette remarque concerne particulièrement les passages versifiés et dialogués. L'export d'Open Office vers la TEI est également aisément réalisable, mais demande, lui aussi, une amélioration des processus de transformation. Normes de balisage XML considéréesChacune de ces normes internationales garantit un balisage conforme au standard XML du W3C. ± XCES ± TMF DTD utiliséesLa description du type de document (ou DTD) est un simple fichier texte brut décrivant selon un formalisme relativement simple le modèle de données utilisé. Une DTD permet de contraindre le contenu d'un document, elle garantit tout à la fois une grande rigueur structurelle et une véritable liberté de conception du modèle de données.
Feuilles de styles XSL utiliséesLe mécanisme des feuilles de style XSL permet de convertir un fichier XML vers un autre format. Dans le cadre du projet, on a testé les transformations vers HTML et vers un fichier XML conforme à une autre DTD. Les feuilles de style créées ou testées dans le cadre du projet peuvent être facilement réutilisées, moyennant quelques modifications, pour la mise en œuvre d'autres transformations.
On a créé diverses versions de cette feuille minirifal2-html.xsl pour produire diffuser sur Internet des fiches (a) offrant un codage HTML 4.01 strict, (b) dont tout élément de style est déporté dans une feuille de style CSS (level1) validée garantissant une compatibilité maximale avec tout type de navigateur et (c) contenant une instruction de tri des données (avec en commentaire d'autres instructions de tri). ± term_lex_sort.xsl (vers HTML) ± term_lex_sort_fra.xsl (vers HTML) ± term_lex_sort_wol.xsl (vers HTML) Corpus textuels balisésProcédure à appliquer si ces pages s'affichent mal
± Bekayi Konate : Tatenibamanan jujɔn, recueil et transcription par Mamadou Diakite (CLAD, Dakar)
± Jeli Baba Sisɔkɔ, Daa ka kɔrɛ kɛlɛ extrait balisé par Mamadou Diakite (CLAD, Dakar).
± Hadamaden josiraw dantigekan = Déclaration universelle des droits de l'homme, version originale téléchargée à des fins expérimentales sur le site du Haut-Commissariat des Nations unies aux droits de l'homme. Il importe de souligner que les membres du projet ne cautionnent pas cette traduction.
± Seegu Bali e Ngaari, Département des langues nationales et de linguistique, Université de Nouakchott
± Nanondiral winndereyankeewal hakkeeje aade = Déclaration universelle des droits de l'homme, version originale téléchargée à des fins expérimentales sur le site du Haut-Commissariat des Nations unies aux droits de l'homme. Il importe de souligner que les membres du projet ne cautionnent pas cette traduction.
± Doomu Yàla, conte wolof anonyme, balisage par Chérif Mbodj (CLAD, Dakar)
± Khadi Fall, Kersa ci tudde sama bopp bindkat, poème diffusé sur le site Lire les femmes écrivains et les littératures africaines.
± Bataaxal gu mag gi ëmb sañ-sañi doomi aadama = Déclaration universelle des droits de l'homme, version originale téléchargée à des fins expérimentales sur le site du Haut-Commissariat des Nations unies aux droits de l'homme. Il importe de souligner que les membres du projet ne cautionnent pas cette traduction.
Corpus lexicaux balisésProcédure à appliquer si ces pages s'affichent mal
± Lexique des élections, Centre de linguistique appliquée de Dakar, Université Cheikh Anta Diop version XML (DTD : minirifal2.dtd)
± Lexique de la santé, Département des langues nationales et de linguistique, Université de Nouakchott version XML (DTD : minirifal2.dtd)
± Projet de dictionnaire wolof-français, Département de linguistique, Université Cheikh Anta Diop De XML vers HTMLDTD fondée sur les les catégories de données de la norme ISO 12 620. version XML (DTD : dicowolof.dtd)
DTD basée sur le filtre d'exportation de Toolbox version XML (DTD : dicowoloftoolboxbis.dtd)
De XML vers XML puis vers HTMLLes feuilles de style permettent de transformer les fichiers XML précédents en fichiers XML conformes à minirifal2.dtd. Bien entendu, le résultat peut ensuite être converti en HTML à l'aide de la feuille de style minirifal2-html.xsl. |
, © 2004 : UCAD - UNkc - ISTI.
dernière mise à jour : 3 décembre 2005