Valkertown Home

2006-03-22-utf-8-y-codificaciones

Desde hace algún tiempo me obsesione con poner una pequeña bandera de Colombia en el prompt y al final lo logré:

La foto no esta centrada intencionalmente

Luego me mude y blogsome sugería utilizar codificación UTF-8 para los envíos y durante la mudanza aparecieron mezclas de codificaciones por lo que decidi investigar un poco el asunto y me encontre que quizá esa sería la solución que estaba buscando para mi bandera.

El resultado fue una migración total de mi entorno de trabajo de codificación ISO 8859-1 (Latin-1) a ISO 10646 Nivel 3 (UTF-8). A primera vista el cambio de codificación no resulta gran cosa, solo la aparición de la dichosa bandera, sin embargo como pueden ver en el screenshot, va mucho más allá, ahora mis terminales son mucho más poderosas de lo que eran anteriormente, con formulas matemáticas y mezclas de caracteres de diferentes lenguas.

EXTENDED BODY:

Básicamente toda la información necesaria para hacer la migración, o simplemente establecerse en UTF-8 esta en el siguiente enlace :

UTF-8 and Unicode FAQ for Unix/GNU/Linux

De todas formas el soporte para UTF-8 Bajo GNU/Linux-CLI ha sido poco menos que perfecto por lo que el cambio ha sido completamente satisfactorio.

Para empezar la migración para X11, aún no he probado en la consola plana, hace falta :

  1. Fuentes UTF-8: En el FAQ-UTF están una buena lista de fuentes UTF-8

  2. Programas con soporte UTF-8 o wide-characters: LA mayoria de programas en GNU/Linux los soportan.

  3. Configuraciones Saber como configurar el entorno para UTF-8, lo que es el proposito de este envio.

Fuentes UTF-8:

Conseguir estas fuentes puede ser complicado ya que las opciones no son muchas y son colecciones son bastante tradicionales.

Sin embargo la gamma disponible para mi resulta bastante satisfactoria.

Por ahora la fuente que he escogido para mis terminales es:

`

-Misc-Fixed-Medium-R-Normal-18-120-100-100-C-90-ISO10646-1

`

Que seguramente esta disponible en casi toda distribución reciente de Xorg.

Programas UTF-8:

Como dije la gran mayoria de programas en GNU soportan UTF-8 así que se reduce a configurarlos. Con la mayoria de los programas de CLI no es nisiquiera necesario configurarlos ya que la terminal es quien se encarga de interpretar los caracteres. Por otra parte los editores si es conveniente configurarlos.

Una lista de programas que soportan UTF-8 esta en el enlace anterior, por lo que no me extiendo.

Mi terminal favorita aterm fue reemplazada por unicode-rxvt; que hasta ahora se ha comportado igual y mejor que aterm.

xterm tambien soporta UTF-8, sin embargo es posible que tenga que ser parchado el código fuente.

Configuración:

La configuración de emuladores de terminal se puede dar en distintas partes como parametros en la llamada al emulador o como parametros en el Xresources o .Xresources, dependiendo hasta que punto se desea realizar la migración.

Voy a dejar este envio incompleto por que me da pereza terminarlo en este punto ya que lo tengo atrasado hace mucho tiempo, solo me queda decir :

  • unicode-rxvt Solo hace falta decirle que utilice la fuente adecuada de las fixed que más les guste, xfontsel es útil para esto

  • Vim y Emacs: Ellos se basan en las variables de entorno y el formato individual del archivo para la codificacion por lo que no hay mucho problema

  • En el .bashrc y el .bash_profile hace falta colocar, si no se quiere que quede todo en español (TODO) cambiar es_CO por en_US :

    1 export LC_CTYPE=es_CO.UTF-8

    2 export LC_ALL=es_CO.UTF-8

Espero que lo poco que esta les sea útil.

EOT

comments powered by Disqus

© 2008-2012 Carlos A. Perilla deepspawn at valkertown dot org | Based on original design by Andreas Viklund