encoding

 

encoding - Manipule les encodages

SYNTAXE

 encoding option ?arg arg ...?

INTRODUCTION

Les chaînes en Tcl sont encodées en utilisant les caractères Unicode 16-bit. Différentes interfaces au système d'exploitation ou applications peuvent générer des chaînes dans d'autres encodages tel que Shift-JIS. La commande encoding lance un pont entre Unicode et ces autres formats.

DESCRIPTION

Exécute une parmi plusieurs opérations relatives à l'encodage, dépendantes de option. Les options légales sont:

encoding convertfrom ?encoding? data Convertit data en Unicode à partir de l'encoding spécifié. Les caractères dans data sont traités comme des données binaires où les 8-bits inférieurs de chaque caractère sont traités comme un seul octet. La séquence d'octets résultante est traitée comme une chaîne dans l'encoding spécifié. Si encoding n'est pas spécifié, l'encodage système courant est utilisé.

encoding convertto ?encoding? string Convertit string d'Unicode en encoding spécifié. Le résultat est une séquence d'octets qui représente la chaîne convertie. Chaque octet est stocké dans les 8-bits inférieurs d'un caractère Unicode. Si encoding n'est pas spécifié, l'encodage système courant est utilisé.

encoding names Renvoie une liste contenant les noms de tous les encodages qui sont actuellement disponibles.

encoding system ?encoding? Fixe l'encodage système à encoding. Si encoding est omis alors la commande retourne l'encodage système courant. L'encodage système est utilisé chaque fois que Tcl transmet des chaînes aux appels systèmes.

EXEMPLE

Il est courant d'écrire des scripts en utilisant un éditeur de texte qui produit une sortie dans l'encodage euc-jp, qui représente les caractères ASCII avec un octet et les caractères Japonais avec deux octets. Ceci facilite l'incorporation de chaînes littérales qui correspondent à des caractères non-ASCII en tapant simplement la chaîne dans le script. Néanmoins, parce que la commande source lit toujours les fichiers en utilisant l'encodage ISO8859-1, Tcl traitera chaque octet dans le fichier comme un caractère séparé qui pointe sur la page Unicode 00. Les chaînes Tcl résultantes ne contiendront pas les caractères Japonais attendus. A la place, elles contiendront une séquence de caractères Latin-1 qui correspondront aux octets de la chaîne originale. La commande encoding peut être utilisée pour convertir cette chaîne en caractères Unicodes Japonais attendus. Par exemple,

 set s [[encoding convertfrom euc-jp "\xA4\xCF"]]

retournera la chaîne Unicode "\u306F", qui est la lettre Hiragana HA.


Catégorie Manuel Tcl/Tk