= Accueil
= Enjeux et objectifs
= Balisage XML
 
4 Encodage Unicode
 
= Communications
= Mauvais affichage ?

 

Agence universitaire de la francophonie, Réseau LTT

Expérimentation de normes de balisage
en langues partenaires

 

L'encodage Unicode des polices africaines

Consigne fondamentale : renoncer au codage ISO-8859

Il convient de renoncer définitivement à l'encodage en ISO latin-1 (ISO-8859-1) à l'aide des vieilles polices True Types (SIL ou autre) et de passer au codage en Unicode, qui offre le net avantage de proposer une table de caractères unique contenant l'ensemble des caractères nécessaires à la représentation d'un grand nombre de polices africaines (illustration d'une page unicode).

Comprendre Unicode

haut de la page

Comment faire pour utiliser Unicode?

  • Utiliser un logiciel réellement compatible Unicode. Parmi ceux-ci, on citera, bien entendu, des suites bureautiques largement répandues comme Office 2000 ou XP (on songe à Word et à Access), Open Office (gratuit) ou Star Office (gratuit pour l'enseignement). Plus spécifiquement, on citera aussi le logiciel XML Spy, utilisé dans le cadre du projet, ainsi que Toolbox (gratuit), la nouvelle version du célèbre progiciel Shoebox, utilisé de longue date pour la description des langues africaines.

  • Utiliser une police Unicode, comme Arial Unicode MS, Lucida sans Unicode, Gentium ou encore SIL Doulos Unicode. Elles se téléchargent aisément sur la toile.

  • Configurer le logiciel pour qu'il utilise bien cette police et préciser, si nécessaire que l'on souhaite un codage Unicode (UTF-8). Par exemple, dans XML Spy, choisir le menu Tools > Options et choisir les onglets Fonts et Encoding.

  • Utiliser un clavier virtuel permettant de disposer immédiatement des caractères Unicode nécessaires. Un clavier virtuel permet de transformer certaines touches inutiles pour encoder immédiatement le caractère désiré. Par exemple, dans le clavier virtuel du bambara, le ? (O ouvert) pourrait être obtenu à l'aide de la touche "q" du clavier français si l'on considère cette lettre comme inutile pour la transcription de cette langue. Le logiciel Keyman est bien adapté pour réaliser cette tâche. Il est également possible d'utiliser le Microsoft Keyboard Layout Creator (MKLC).

haut de la page

Inventaire des caractères nécessaires à la création d'un nouveau clavier

La première démarche consiste à dresser l'inventaire des caractères unicode qui ne figurent pas sur le clavier français alors qu'ils sont nécessaires pour encoder les textes de la langue considérée. Pour ce faire, on recherchera l'identification précise des caractères dans une table Unicode:

On veillera à décrire chaque caractère en minuscule et en capitale dans un document qui précisera :

  • le dessin du caractère ;
  • le nom officiel du caractère ;
  • le bloc Unicode dans lequel il est présent (le plus souvent : Latin de base, Supplément latin-1, Latin étendu-A, Latin étendu-B, Alphabet phonétique international (API) et Lettres modificatives avec chasse) ;
  • sa notation en Unicode ;
  • sa notation sous forme d'entité en XML.
ɲ Ɲ
nom : lettre minuscule latine N hameçon à gauche nom : lettre majuscule latine N hameçon à gauche
bloc : extensions IPA bloc : latin étendu B
notation Unicode : U+0272 notation Unicode : U+019D
entité : ɲ entité : Ɲ

haut de la page

Le clavier virtuel Keyman

Création - Installation - Lancement - Configuration - Claviers expérimentaux

Créer un clavier original

Télécharger le logiciel Keyman Developer, l'installer et à l'aide de son interface Tike, créer un clavier virtuel (on trouve un résumé de la procédure sur le site de l'équipe Llacan du CNRS). Le logiciel permet de travailler de manière très intuitive, de créer une documentation visuelle à propos du nouveau clavier et de créer un pack d'installation aisément diffusable.

haut de la page

Installer un clavier virtuel existant

1. Télécharger le logiciel Keyman, lequel s'installe automatiquement sous Windows : il suffit de lancer l'exécutable et de suivre les différentes étapes de la procédure d'installation.

2. Télécharger le clavier.

haut de la page

Lancer le clavier virtuel

1. Choisir le menu Démarrer > Programme > Tavultesoft Keyman > Keyman.

2. L'icône de Keyman apparaît à l'extrème droite de la barre des tâches.

3. Cliquer à gauche sur l'icône et choisir le clavier souhaité : le clavier devient actif et l'icône de Keyman est remplacée par celle du clavier (si elle existe).

Il convient de noter que cette dernière étape doit être répétée à chaque fois que l'on lance un nouveau programme.

4. Pour afficher à l'écran le clavier visuel correspondant (s'il existe), cliquer à droite dans l'icône Keyman de la barre des tâches et choisir l'option "Visual Keyboard"

haut de la page

Configurer le clavier virtuel

1. Choisir le menu Démarrer > Programme > Tavultesoft Keyman > Keyman Configuration (ou cliquer à droite sur l'icône de Keyman dans la barre des tâches et choisir "Keyman Configuration".

2. Pour installer un nouveau clavier : choisir le bouton "install Keyboard".

3. Pour disposer d'un clavier visuel transparent, choisir le bouton "Add" du menu "visual Keyboard" et sélectionner le bon fichier d'extension *.kvk (p.ex. bambara.kvk).

haut de la page

Claviers créés avec Keyman dans le cadre du projet de recherche
balante informations télécharger l'archive avertissements
bambara informations télécharger l'archive avertissements
pulaar informations télécharger l'archive avertissements
serer informations télécharger l'archive avertissements
wolof informations télécharger l'archive avertissements

haut de la page

Contenu de l'archive :
  • nom de langue.EXE : auto-installation de Keyman, du clavier et de sa version visuelle
  • nom de langue.KMP : auto-installation du clavier et de sa version visuelle (si vous possédez déjà Keyman)
  • nom de langue.KMX : fichier source compilé : installe uniquement le clavier
  • nom de langue.KMN : fichiers source non compilé (permet de modifier le clavier à l'aide du Keyman Developper
  • nom de langue.KVK : fichier du clavier visuel
  • nom de langue.KPS : sources décrivant le paquet d'installation
  • nom de langue.HTML et sous-répertoire : description du clavier lisible à l'aide d'un navigateur pour Internet
  • nom de langue.BMP : icone représentant le clavier (fichier image)
  • lisez-moi.TXT : fichier d'aide à l'installation

haut de la page

Créer un clavier Windows avec Microsoft Keyboard Layout Creator (MKLC)

Installation du logiciel - Création du clavier - Installation du clavier - Claviers expérimentaux

Installer le logiciel MKLC

Télécharger le logiciel Microsoft Keyboard Layout Creator (MKLC) et son complément indispensable, le paquet Microsoft .NET Framework. Installer le second avant le premier.

haut de la page

Créer un clavier MKLC

L'interface de saisie est très simple et le clavier peut aisément être testé en cours de travail. La tâche sera d'autant plus simple que l'on veillera aux points suivants :

  • Lire l'aide, courte et bien conçue.
  • Sélectionner dès le départ la bonne apparence du clavier (Menu View - Options), un changement plus tardif semblant générer des erreurs lors de la compilation finale.
  • Le clavier sera toujours associé à une celui d'une langue possédant déjà un clavier dans Windows. On s'épargnera donc une part de la tâche d'encodage en important un clavier existant (menu File - Load existing keyboard) et en l'adaptant à ses besoins.
  • Sélectionner une police Unicode pour visualiser correctement les touches (menu View - Fonts).
  • Sauvegarder la définition du clavier pour pouvoire la reprendre ultérieurement (Menu File - Save source file as...
  • Tester le clavier avant de le compiler.
  • Éviter des conflits potentiels avec des raccourcis-claviers propres à Windows.
  • Songer au fait que les images du clavier créées par le logiciel ne rendent pas compte des caractères créés à l'aide des touches mortes.
  • N'installer définitivement un clavier que lorsqu'on est sûr qu'il est bien finalisé. En effet, une fois qu'un clavier est installé dans Windows, il semble impossible de le supprimer ou de le renommer.

haut de la page

Installer le clavier MKLC
  • Décompresser l'archive.
  • Lancer le fichier *.MSI.
  • Lancer le menu Démarrer - Paramètres - Panneau de configuration - Options régionales et linguistiques.
  • Sélectionner Langues.
  • Ajouter le clavier désiré à l'intérieur de la langue d'entrée par défaut « français ».
  • Afficher la barre des langues et dans la langue par défaut « français », sélectionner le clavier désiré.

N.B. :
1. Cette procédure est valable pour Windows XP. Sous Windows 2000, le clavier ne semble pas apparaître dans la barre des langues.
2. Les claviers MKLC ne semblent pas fonctionner dans le logiciel Toolbox, lequel fonctionne très bien avec Keyman.

haut de la page

Claviers créés avec MKLC dans le cadre du projet de recherche
Clavier Sénégal1

Le clavier Sénégal1 permet de saisir du texte dans les langues suivantes : bambara, balante, pulaar, serer, woloof, joola, soninke. Il ne s'agit pas d'un clavier destiné à des phonéticiens. Sa seule ambition est de permettre à tout individu de saisir correctement les caractères de sa langue.

Comme le clavier permet d'écrire un grand nombre de langues différents et que l'on a supposé que la plupart des utilisateurs utiliseront un clavier français de France, il a été décidé de conserver l'intégralité du clavier français et de permettre l'encodage des langues sénégalaises à l'aide de touches mortes. Bien entendu, il est aussi possible de créer un clavier pour chaque langue, comme on l'a fait avec Keyman.

haut de la page

Clavier bambara - wolof

Ce clavier de saisie a été créé par Mamadou Diakité (CLAD, UCAD). Il s'agit typiquement d'un clavier orthographique rendant les caractères propres au bambara et au wolof directement accessibles, sans passer par des touches mortes.

haut de la page

Avertissements

Les claviers virtuels ont été créés à des fins expérimentales : les concepteurs déclinent toute responsabilité en cas d'usage en dehors du cadre de leur action de recherche en réseau. Ni le choix des glyphes ni la disposition des touches ne sont conformes à une norme officielle ou à un décret légal. Ces claviers répondent d'abord aux besoins de linguistes travaillant à la description des langues de Mauritanie et du Sénégal. Toute remarque à leur propos peut être adressée aux , soucieux de les adapter à un usage plus général.

Les claviers ne fonctionnent que dans les logiciels compatibles avec les tables de caractère Unicode et réellement conçus pour permettre un mélange des écritures au sein d'un même document. Les caractères ne s'afficheront qu'à la condition d'utiliser une police Unicode suffisamment complète (p.ex. Arial Unicode MS). Ce type de police n'est généralement disponible que dans une version récente de Windows (version 2000 ou XP).

Le respect de la norme Unicode garantit un codage correct, non ambigu et universel des caractères, mais les polices ne rendent pas toujours correctement les ligatures et les diacritiques. Le nouveau format de fichier de polices multiplateforme OpenType® (Adobe et Microsoft) de même que le projet Graphite (Sil) devraient permettre, à l'avenir, une plus grande précision typographique. Les problèmes d'alignement des signes diacritiques peuvent parfois être résolus plus modestement à l'aide de la commande de formatage du traitement de texte. Par exemple, le modèle de document pour Word 2000 modèle général.dot, créé par les partenaires du projet, propose les styles caron et souscrit pour un meilleur rendu des signes diacritiques du clavier balante.

Toute utilisation du logiciel Keyman qui dépasse une expérimentation de plus de 30 jours suppose une acquisition légale de ce logiciel auprès de la société Tavultesoft.

haut de la page


, © 2004 : UCAD - UNkc - ISTI.
dernière mise à jour : 16 août 2005

Retour vers Refer