Préface
La présente constitue la deuxième édition de la norme CAN/CSA-Z243.4.1, Méthode canadienne de classement alphanumérique. Elle remplace l'édition préliminaire (1992), Z243.4.1, Méthode canadienne de classement alphanumérique pour les jeux de caractères de la norme CAN/CSA-Z243.4. Il est devenu nécessaire de normaliser la séquence de tri car la diversité des méthodes de codage ne permet pas de trier toujours de la même manière les listes utilisées dans diverses architectures de systèmes. La présente norme porte plus précisément sur les caractères graphiques utilisant l’alphabet.
La CSA remercie particulièrement M. Alain LaBonté, du Secretariat du Conseil du trésor du Québec, pour sa collaboration soutenue à la rédaction et à la révision technique des versions anglaise et française de cette norme.
La présente norme a été préparée par le Sous-comité sur les jeux de caractères codes sous l’autorité du Comité technique sur la technologie de l’information et du Comité directeur de normalisation sur la technologie de l’information. Elle a été homologuée par ces comités et approuvée comme Norme nationale du Canada par le Conseil canadien des normes.
Domaine d'application
1.1 Application
La présente norme énonce l'ordre de classement alphanumérique lexical qui correspond aux attentes culturelles canadiennes pour le français et l'anglais. Cette norme a pour objet de définir un tri à usage général pour les chaînes alphanumériques utilisant le répertoire de caractères graphiques des normes CAN/CSA-Z243.4 et CSA T500, dans toutes les situations où il y a intervention humaine ou présentation de résultats triés à des utilisateurs.
1.2 Classement plutôt que classification
Le tri est fondé sur le principe du classement par mots plutôt que sur celui de la classification des annuaires téléphoniques. Le classement des annuaires téléphoniques dépend dans une large mesure de l'application et il fait appel au classement par mots comme plus petit dénominateur commun. Ainsi, cette norme pourrait être utilisée comme base commune pour le classement des annuaires téléphoniques.
1.3 Répertoires visés
La norme définit les tableaux de tri pour l'ensemble des répertoires de caractères graphiques définis dans les normes CAN/CSA-Z243.4 et CSA T500. Il est à noter qu'en raison de la nécessité particulière d'utiliser une technique de composition de caractères pour coder le répertoire de caractères de la norme CSA T500 pour les applications du télétex, cette norme définit des tableaux de tris complémentaires pour celle-ci. Ces tableaux utilisent comme référence certains caractères précomposés du jeu de caractères universel (norme ISO/CEI 10646-1) comme équivalents des séquences admissibles du répertoire de la norme CSA T500, lorsque ces caractères existent dans la norme ISO/CEI 10646-1. On présume qu'une validation et une conversion préalable en caractères précomposés a été faite dans le cas où le codage de la norme CSA T500 a été utilisé initialement.
1.4 Indépendance du codage
Comme, dans certains cas, plusieurs combinaisons binaires sont utilisées pour la représentation des mêmes caractères graphiques, cette norme ne tient pas compte de ces combinaisons; on y utilise plutôt, dans tous les tableaux, le nom des caractères précomposés accompagnés de la combinaison binaire équivalente dans le jeu de caractères universel (ISO/CEI 10646-1) comme référence ultime. Cette façon de procéder pourrait permettre d'élargir le domaine d'application aux jeux de caractères normalisés et aux méthodes de codage adoptés par d'autres organismes internationaux ou par des fabricants de matériel particulier.
1.5 Ordres de classement lexical informatisés
Cet ordre de classement alphanumérique lexical normalisé est l'ordre que les logiciels de tri alphanumérique à usage général doivent produire au Canada. C'est aussi l'ordre que les fichiers informatisés indexés et les listes ordonnées de bases de données doivent suivre au Canada quand ils contiennent des données alphanumériques. Les comparaisons électroniques pour lesquelles on prévoit des résultats conformes à cette norme doivent respecter l'ordre spécifié dans la norme; à cette fin, on recommande d'utiliser une clé de tri formulée selon l'algorithme de conformité de l'article 5.2.
1.6 Noms de caractères
Comme les noms utilisés dans la norme ISO/CEI 10646-1 ont subi des changements et que ces noms ne sont pas uniques, puisque différentes langues sont utilisées tant dans les normes internationales que dans les normes canadiennes, la référence aux combinaisons binaires du jeu de caractères universel plutôt qu'aux noms de caractères comme identificateurs uniques apparaît beaucoup plus stable et doit lui être préférée. L'identificateur de ces combinaisons prend la forme Uxxxx, où xxxx représente la valeur hexadécimale de la combinaison binaire utilisée pour un caractère équivalent dans la norme ISO/CEI 10646-1.