Gentoo Logo

Usando UTF-8 con Gentoo

Contenido:

1.  Codificación de caracteres

¿Qué es la codificación de caracteres?

Los computadores no entienden texto por sí mismas, de manera que cada carácter está representado por un número. Tradicionalmente, cada conjunto de números usados para representar alfabetos y caracteres (conocidos como sistema de codificación, codificación o conjunto de caracteres) han sido limitados en su tamaño por las limitaciones presentes en el hardware de las computadoras.

La historia de codificación de caracteres

El conjunto de caracteres más común (o al menos el más ampliamente aceptado) es el ASCII (American Standard Code for Information Interchange o Código Norma Norteamericano para el Intercambio de Información). Se ha dicho que el ASCII es la norma de software más exitosa jamás. El ASCII moderno fue normalizado en 1986 (ANSI X3.4, RFC 20, ISO/IEC 646:1991, ECMA-6) por el American National Standards Institute o Instituto Nacional Norteamericano para Normas.

ASCII se ciñe estrictamente a siete bits, lo cual significa que usa patrones de bits que pueden ser representados por siete dígitos binarios, que suministra un rango de 0 a 127 en números decimales. Estos incluyen 32 caracteres de control que no son visibles, la mayoría de los cuales están entre el 0 y el 31, con el último caracter de control, DEL o delete (borrar) en la posición 127. Los caracteres del 32 al 126 son visibles: un espacio, caracteres de puntuación, letras del alfabeto latino y los números.

El octavo bit en ASCII fue originalmente utilizado como un bit de paridad, para comprobación de errores. Si no hace falta, se puede dejar en 0. Esto significa que en ASCII, cada caracter es representado por un solo byte.

Aunque ASCII era suficiente para las comunicaciones en inglés moderno, esto no hacía las cosas fáciles para otros idiomas europeos que incluían caracteres acentuados. Las normas ISO 8859 fueron desarrolladas para cubrir estas necesidades. Eran compatibles con la versión original de ASCII, pero en vez de dejar el octavo bit en blanco fue utilizado para proporcionar 127 caracteres adicionales en cada codificación. Las limitaciones de ISO 8859 pronto se hicieron sentir, existiendo actualmente 15 variantes de esta norma (8859-1 a la 8859-15). Más allá de los valores compatibles con ASCII, existen conflictos en la representación de los caracteres. Para complicar aún más la interoperabilidad entre distintas codificaciones, se usa Windows-1252 en algunas versiones de Windows para representar idiomas europeos occidentales. Este es un super-conjunto de la ISO 8859-1, con varias diferencias. Sin embargo, todos estos conjuntos de caracteres retienen la compatibilidad con ASCII.

El necesario desarrollo de codificaciones de un solo byte para alfabetos no-latinos, tales como el EUC (Extended Unix Encoding o Codificación Extendida para Unix), usados para japonés y koreano (y a menor grado para chino) agregó más confusión, mientras que otros sistema operativos usaban otros conjuntos completamente distintos para los mismos idiomas, por ejemplo, Shift-JIS e ISO-2022-JP. Los usuarios que requerían usar glifos en cirílico tenían que escoger entre KOI8-R para ruso o búlgaro o KOI8-U para ukraniano, encima de las demás codificaciones cirílicas como el fallido ISO 8859-5 y el más común Windows-1251. Todos estos conjuntos de caracteres rompieron con la compatibilidad con el ASCII (aunque la codificación KOI8 coloca los caracteres cirílicos en el órden latino, de manera de conservar la posibilidad de lectura, pasado a mayúsculas en un terminal ASCII, si se llegara a perder el octavo bit).

Esto ha causado confusión e inabilidad casi total de comunicación entre idiomas, especialmente a través de alfabetos distintos. Aquí ingresa Unicode.

¿Qué es Unicode?

Unicode desecha el límite tradicional de los conjuntos de caracteres de un sólo byte. Usa 17 "planos" de 65,536 codificaciones para describir un máximo de 1,114,112 caracteres. Como el primer plano, también conocido como Basic Multilingual Plane (Plano Multilingüe Básico) o BMP contiene prácticamente todo lo que pudiera usarse jamás, muchos han asumido que el Unicode es un conjunto de caracteres de 16 bits.

El Unicode ha sido mapeado en muchas maneras diferentes, pero las dos más comunes son UTF (Unicode Transformation Format o Formato de Transofrmación Unicode) y UCS (Universal Character Set o Conjunto de Caracteres Universal). El número que sigue las siglas UTF indican el número de bits en una unidad, mientras que el número que sigue las siglas UCS indica el número de bytes. UTF-8 se ha convertido en el medio más difundido para el intercambio de texto en Unicode dada su implementación limpia de ocho bits y es el tema de este documento.

UTF-8

La codificación UTF-8 es de longitud variable, lo cual significa en este caso, que utiliza de uno a cuatro bytes por símbolo. Así, el primer byte UTF-8 se utiliza para codificar los caracteres ASCII, permitiendo completa compatibilidad con este conjunto de caracteres. Además, significa que los caracteres Latin y de UTF-8 son intercambiables con un pequeño aumento en el tamaño de la data, ya que usa solo el primer bit. Los usuarios de alfabetos orientales, como el japonés, no están tan contentos, ya que les han asignado cuentas mayores de bytes que resulta en un aumento hasta del 50% en su data.

¿En qué puede ayudar el UTF-8?

UTF-8 permite trabajar en un entorno multilingüe normado internacionalmente aceptado con un nivel comparativamente bajo de redundancia de datos. El UTF-8 es la manera preferida para transmitir caracteres no-ASCII a través del Internet por correo electrónico, IRC o casi cualquier otro medio. A pesar de esto, muchos opinan que el uso de UTF-8 en las comunicaciones en línea es abusivo. Vale la pena siempre estar atento de la actitud hacia UTF-8 en determinados canales, listas de correo o grupo usenet antes de usar UTF-8 no-ASCII.

2.  Configurando UTF-8 en Gentoo Linux

Buscando o Creando Localizaciones UTF-8

Ahora que entendemos los principios detrás de Unicode, podemos empezar a usar UTF-8 con el sistema.

El requerimiento preliminar para UTF-8 es tener instalada una versión de glibc con soporte para idiomas nacional. El medio recomendado para hacer esto es el archivo /etc/locale.gen. Está más allá del alcance de este documento explicar el uso de este archivo, ya que se encuentra explicado en Guía Gentoo de Localización.

Luego, debemos decidir si ya existe una localización UTF-8 para nuestro idioma, o si debemos crear uno.

Listado de Código 2.1: Revisar si existe una localización UTF-8

(Sustituya "es_ES" por la localización deseada)
# locale -a | grep 'es_ES'
es_ES
es_ES.iso88591
es_ES.iso885915@euro
es_ES.utf8
es_ES@euro

Por la salida de este comando, debemos usar el resultado con un sufijo similar a .utf8. Si no se producen resultados que tengan este sufijo, debemos crear una localización compatible con UTF-8.

Nota: Solamente ejecute los comandos listados a continuación si no tiene una localización UTF-8 disponible para su idioma.

Listado de Código 2.2: Creando una localización UTF-8

(Sustituya "es_ES" por la localización deseada)
# localedef -i es_ES -f UTF-8 es_ES.utf8

Otra manera de incluir una localización UTF-8 es agregarla al archivo /etc/locale.gen y generar los locales necesarios con el comando locale-gen.

Listado de Código 2.3: La línea en /etc/locales.gen

es_ES.UTF-8/UTF-8

Estableciendo la Localización

Existe una variable de entorno que se debe configurar para utilizar nuestra localización UTF-8 nueva: LANG (esta variable toma precedencia por encima de la configuración de LC_ALL también). También hay distintas maneras de configurarla; unos prefieren tener ambientes UTF-8 para usuarios específicos, en cuyo caso se configura en su ~/.profile (si usa /bin/sh) o sino ~/.bash_profile o ~/.bashrc (si se usa /bin/bash).

Otros prefieren establecer la localización de manera global. Una circunstancia específica donde el autor recomienda particularmente hacer esto es cuando se usa /etc/init.d/xdm, ya que este guión inicia el gestor de ventanas y el entorno del escritorio antes de evaluar los distintos archivos de inicio del intérprete de comandos, antes que éstos puedan establecer variables de entorno.

Establecer la localización de manera global debe hacerse usando /etc/env.d/02locale. El archivo debe parecerse algo a:

Listado de Código 2.4: Archivo ejemplo de /etc/env.d/02locale

(Como siempre, cambie "es_ES.UTF-8" según la localización)
LANG="es_ES.UTF-8"

Nota: También puede sustituir LC_ALL por LANG. Esto configura la localización para todas las categorías, incluyendo la numérica y monetaria. En unos pocos sistema podría causar problemas. Sin embargo, la mayoría de los usuarios deberían poder usar LC_ALL sin problemas. Para mayor información en las categorías afectadas si usamos LC_ALL, por favor lea (en inglés) la página de localizaciones de GNU.

Luego, el entorno debe actualizarse con los cambios.

Listado de Código 2.5: Actualizando el entorno

# env-update
>>> Regenerating /etc/ld.so.cache...
 * Caching service dependencies ...
# source /etc/profile

Ahora, ejecute locale sin parámetros para ver si tenemos las variables adecuadas según nuestro entorno:

Listado de Código 2.6: Revisando si nuestra localización funciona en nuestro entorno

# locale
LANG=
LC_CTYPE="es_ES.UTF-8"
LC_NUMERIC="es_ES.UTF-8"
LC_TIME="es_ES.UTF-8"
LC_COLLATE="es_ES.UTF-8"
LC_MONETARY="es_ES.UTF-8"
LC_MESSAGES="es_ES.UTF-8"
LC_PAPER="es_ES.UTF-8"
LC_NAME="es_ES.UTF-8"
LC_ADDRESS="es_ES.UTF-8"
LC_TELEPHONE="es_ES.UTF-8"
LC_MEASUREMENT="es_ES.UTF-8"
LC_IDENTIFICATION="es_ES.UTF-8"
LC_ALL=es_ES.UTF-8

Eso es todo. En este momento está usando la localización UTF-8 y el siguiente paso es configurar las aplicaciones usadas en el día a día.

3.  Soporte para Aplicaciones

Cuando Unicode empezó a ganar aceptación en el mundo del software, los conjuntos de caracteres con codificaciones multi-byte no encajaban bien con lenguajes de programación como C, en la que están escritos muchos programas que la gente usa a diario. Aún hoy algunos programas no manejan UTF-8 correctamente. ¡Afortanadamente la mayoría sí!

Nombres de archivos, NTFS y FAT

Hay varias opciones para soporte de idiomas nativos (NLS) en el menú de configuración del kernel Linux, ¡pero es importante no confundirse! Mayormente, lo único que hay que hacer es construir el soporte para UTF-8 en el kernel y cambiar la opción por defecto a UTF-8.

Listado de Código 3.1: Pasos para configurar el kernel para NLS con UTF-8

File Systems -->
  Native Language Support -->
    (utf8) Default NLS Option
    <*> NLS UTF8
    (También <*> otros conjuntos de caracteres usados
  por los sistemas de archivo FAT o CDROMs Joliet.)

Si tiene planes de montar particiones NTFS, tal vez tenga que especificar como parámetro a mount, la opción nls=. Si desea montar particiones FAT, tal vez necesite especificar una opción codepage= con mount. Opcionalmente se puede establecer un codepage por defecto para FAT en la misma configuración del kernel. Note que la opción codepage tomará precedencia por encima de la opción especificada en la configuración del kernel.

Listado de Código 3.2: Configuración FAT en el kernel

File Systems -->
  DOS/FAT/NT Filesystems  -->
    (437) Default codepage for fat

Debería evitar configurar el Default iocharset for fat como UTF-8, ya que esto no es recomendado. En vez de so, tal vez quiera pasar el parámetro utf8=true al montar particiones FAT. Para más información, vea la página man mount y la documentación acerca de la configuración del kernel en /usr/src/linux/Documentation/filesystems/vfat.txt.

Para cambiar la codificación de los nombres de archivos, use app-text/convmv.

Listado de Código 3.3: Ejemplo del uso de convmv

# emerge --ask app-text/convmv
# convmv -f codificación-actual -t utf-8 archivo
(Formato del comando)
# convmv -f <codificación-actual> -t utf-8 <nombrearchivo>
(Sustituya iso-8859-1 por el conjunto de caracteres del cual está convirtiendo)
# convmv -f iso-8859-1 -t utf-8 nombrearchivo

Para cambiar la codificación del contenido de los archivos, use la herramienta iconv, que forma parte de glibc:

Listado de Código 3.4: Ejemplo del uso de iconv

(sustituya iso-8859-1 por el conjunto de caracteres que va a convertir)
(Revise si la salida se ve bien)
# iconv -f iso-8859-1 -t utf-8 archivo 
(Para convertir un archivo, debe crear otro)
# iconv -f iso-8859-1 -t utf-8 archivo > archivo-nuevo

Para este propósito también se puede usar la herramienta app-text/recode.

La consola del sistema

Importante: Hará falta tener instalado >=sys-apps/baselayout-1.11.9 para poder tener Unicode en la consola.

Para usar UTF-8 en la consola, debe modificarse el archivo /etc/rc.conf colocando UNICODE="yes". Lea también los comentarios en el archivo -- es importante contar con una fuente tipográfica que tenga una buena gama de caracteres si quiere hacer uso pleno de Unicode. Para que esto funcione, asegúrese de haber creado adecuadamente una localización Unicode, tal como se explica en el Capítulo 1.

Debe asignarse un mapa de teclado Unicode a la variable de entorno KEYMAP en /etc/conf.d/keymaps.

Listado de Código 3.5: Ejemplo parcial de /etc/conf.d/keymaps

(Cambie "es" a su mapa local)
KEYMAP="es"

Ncurses y Slang

Nota: Ignore cualquier mención acerca de Slang en esta sección si no lo usa o si tampoco lo tiene instalado.

Es buena idea agregar unicode a sus parámetros USE globales en /etc/make.conf y luego hacer emerge otra vez a sys-libs/ncurses y sys-libs/slang si es apropiado. Portage hará esto automáticamente al actualizar el sistema:

Listado de Código 3.6: Actualizando el sistema

# emerge --update --deep --newuse world

También debemos reconstruir los paquetes que enlazan con estos, ya que se han aplicado cambios a los parámetros USE. La herramienta que usamos (revdep-rebuild) es parte del paquete gentoolkit.

Listado de Código 3.7: Reconstruyendo los programa enlazados a ncurses o slang

# revdep-rebuild --soname libncurses.so.5
# revdep-rebuild --soname libslang.so.1

KDE, GNOME y Xfce

Todos los principales entornos de escritorio tienen soporte completo para Unicode y no requieren configuración adicional, apartando lo cubierto en esta guía. Esto es porque los kits gráficos subyacentes (Qt o GTK+2) ya reconocen UTF-8, por ende, todas las aplicaciones que hacen uso de estos kits deben reconocer UTF-8 también, sin hacer nada más.

Las excepciones a esta regla son Xlib y GTK+1. GTK+1 requiere una especificación de fuente iso-10646-1 en el ~/.gtkrc, como -misc-fixed-*-*-*-*-*-*-*-*-*-*-iso10646-1. Además, las aplicaciones que utilizen Xlib o Xaw también necesitarán una especificación de fuente similar, porque si no, no trabajarán.

Nota: Si tiene por ahí una versión del centro de control gnome1, úsela para escoger cualquier fuente iso10646-1 de allí.

Listado de Código 3.8: Ejemplo de ~/.gtkrc (para GTK+1) que define una fuente compatible con Unicode

style "user-font"
{
    fontset="-misc-fixed-*-*-*-*-*-*-*-*-*-*-iso10646-1"
}
widget_class "*" style "user-font"

Si una aplicación tiene soporte Unicode para ambos interfaces gráficos, Qt y GTK+2, generalmente obtendrá mejores resultados con GTK+2.

X11 y las fuentes

Importante: x11-base/xorg-x11 tiene mucho mejor soporte para Unicode que XFree86, por lo que es altamente recomendado.

Las fuentes (tipos) TrueType tienen soporte para Unicode y la mayoría de los cuales vienen con Xorg tienen un soporte bastante impresionante respecto a la amplitud de caracteres, aunque obviamente, no todos los glifos disponibles en Unicode tienen su correspondiente. Para construir fuentes (incluyendo el conjunto Bitstream Vera) con soporte para los caracteres Asiáticos Orientales en X, asegúrese de activar el parámetro USE cjk. Muchas otras aplicaciones usan este parámetro, de manera que vale la pena agregarlo permanentemente.

También varios otros paquetes de fuentes (tipos) en Portage soportan Unicode.

Listado de Código 3.9: Opcional: Instalar más fuentes con soporte para Unicode

# emerge terminus-font intlfonts freefonts cronyx-fonts corefonts

Entornos gráficos y emuladores de terminal

Los entornos gráficos que no esten construidos sobre GTK o Qt generalmente tienen buen soporte para Unicode, ya que muchas veces usan la librería Xft para el manejo de fuentes. Si su entorno gráfico no usa Xft para las fuentes, entonces todavía puede usar la especificación de fuente mencionada en la sección anterior como una fuente Unicode.

Los emuladores de terminales que usen Xft y soportan Unicode son más difiles de encontrar. Aparte de Konsole y gnome-terminal, las mejores opciones en Portage son x11-terms/rxvt-unicode, xfce-extra/terminal, gnustep-apps/terminal, x11-terms/mlterm o sencillamente x11-terms/xterm construido con el parámetro USE unicode e invocado como uxterm. app-misc/screen también soporta UTF-8 al invocarse como screen -u o al agregar los siguientes parámetros al archivo ~/.screenrc:

Listado de Código 3.10: Para activar soporte UTF-8 en ~/.screenrc

defutf8 on

Vim, emacs, xemacs y nano

Vim proporciona un soporte completo para UTF-8 y por si solo detecta los archivos UTF-8. Para más información en Vim, :help mbyte.txt.

Emacs versión 22.x y mayores también proporciona un soporte completo de UTF-8. Xemacs 22.x todavía no soporta la combinación de caracteres.

Versiones anteriores de Emacs y/o Xemacs podrían requerir la instalación de app-emacs/mule-ucs y/o app-xemacs/mule-ucs y agrega lo siguiente al archivo ~/.emacs para obtener pleno soporte para los lenguajes CJK (chino, japonés y koreano) en UTF-8:

Listado de Código 3.11: Soporte CJK UTF-8 para Emacs

(require 'un-define)
(require 'jisx0213)
(set-language-environment "Japanese")
(set-default-coding-systems 'utf-8)
(set-terminal-coding-system 'utf-8)

Nano proporciona soporte pleno para UTF-8 desde la versión 1.3.6.

Intérprete de comandos

Actualmente, bash suministra soporte pleno para Unicode a través de la librería readline de GNU. Z Shell (zsh) ofrece soporte Unicode con la USE unicode.

El shell C, tcsh y ksh no tienen soporte alguno para UTF-8.

Irssi

Irssi tiene soporte pleno para UTF-8, aunque se requiere que el usuario configure una opción.

Listado de Código 3.12: Activando soporte para UTF-8 en irssi

/set term_charset UTF-8

Para los canales donde se intercambian caracteres no ASCII en conjuntos de caracteres no UTF-8, el comando /recode puede usarse para convertir los caracteres. Escriba /help recode para más información.

Mutt

El cliente de correo electrónico mutt tiene muy buen soporte para Unicode. No se requiere colocar nada en los archivos de configuración. Mutt trabajará en un entorno unicode sin modificación alguna si todos los archivos de configuración (incluyendo la firma) estan codificados en UTF-8.

Nota: Tal vez vea algún '?' en su correo al leerlo con mutt. Este es el resultado del uso de un cliente de correo que no indica cuál conjunto de caracteres utiliza. No se puede hacer mucho acerca de esto, aparte de pedirles que configuren su cliente correctamente.

Hay más información disponible en el Wiki Mutt.

Man

La páginas man forman una parte integral de cualquier computador Linux. Para asegurarnos que los caracteres unicode aparezcan correctamente, modifique el archivo /etc/man.conf y reemplace la línea que se muestra a continuación:

Listado de Código 3.13: Modificaciones a man.conf para soportar Unicode

(Esta es la línea que vamos a cambiar)
NROFF           /usr/bin/nroff -Tascii -c -mandoc
(Sustituir la anterior por esta que sigue)
NROFF           /usr/bin/nroff -mandoc -c

elinks y links

Estos son los navegadores de consola más comunes y veremos como podemos activar el soporte para UTF-8. En elinks y links hay dos formas para hacerlo, uno usando la opción Setup dentro del mismo navegador o modificando el archivo de configuración. Para activas esta opción en el navegador, navegue a un sitio web con elinks o links y luego pulse Alt+S para obtener el menu de configuración, seleccione las opciones de la consola (en inglés, Terminal options) o pulse una T. Baje con la flecha del teclado y selecciones la última opción UTF-8 I/O pulsando Enter. Luego Save y salga del menu. En links tal vez tenga que repetir Alt+S y pulsar S para salvar la configuración. La modificación del archivo de configuración se muestra a continuación.

Listado de Código 3.14: Activando soporte UTF-8 en elinks/links

(Para elinks, modifique /etc/elinks/elinks.conf o ~/.elinks/elinks.conf y agregue la siguiente línea)

set terminal.linux.utf_8_io = 1

(Para links, modifique ~/.links/links.cfg y aregue la siguiente línea)

terminal "xterm" 0 1 0 us-ascii utf-8

Samba

Samba es una suite de software que implementa el protocolo SMB (Server Message Block) en sistema Unix, tales como Macs, Linux y FreeBSD. El protocolo es a veces referido como Common Internet File System (CIFS). Samba también incluye el sistema NetBIOS - utilizado para compartir archivos en redes windows.

Listado de Código 3.15: activando UTF-8 en Samba

(Modifique /etc/samba/smb.conf agregando lo siguiente bajo la sección [global])
dos charset = 1255
unix charset = UTF-8
display charset = UTF-8

Probándolo todo

Existen numerosos sitios UTF-8. net-www/w3m, net-www/links, net-www/elinks, net-www/lynx y todos los navegadores basados en Mozilla (incluyendo a Firefox) soportan UTF-8. Konqueror y Opera también tienen soporte pleno para UTF-8 también.

Al usar uno de los navegadores de texto, asegúrese de usar un terminal que soporte Unicode.

Si llegara a ver algun caracter en forma de caja con letras o números adentro, esto significa que la fuente no tiene el dibujo del caracter para el símbolo o glifo que necesita UTF-8, por lo que muestra una cajita con el código hexadecimal del símbolo UTF-8.

Métodos para ingresar caracteres

En X, se puede usar las llamadas teclas muertas para escribir caracteres que no aparecen en el teclado. Estos funcionan pulsando la tecla Alt derecha (en algunos países, AltGr) junto con una tecla opcional de la sección no alfabética del teclado, justo a la izquierda de la tecla Enter, soltándolas y a continuación pulsando una letra. La tecla muerta debe entonces modificar la letra. Se pueden efectuar aún más modificaciones pulsando la tecla Shift al mismo tiempo que AltGr y el caracter modificador.

Para activar las teclas muertas en X, necesita usar un mapa de teclado que las soporte. La mayoría de los mapas europeos ya tienen teclas muertas con el mapa por defecto. Sin embargo, esto no es así con los mapas norteamericanos. Aunque exista algún grado de inconsistencia, la solución más sencilla parece ser usar un mapa "en_US" en vez de "us", por ejemplo, el mapa se especifica en /etc/X11/xorg.conf así:

Listado de Código 3.16: Ejemplo parcial de /etc/X11/xorg.conf

Section "InputDevice"
    Identifier "Keyboard0"
    Driver     "kbd"
    Option     "XkbLayout" "en_US" # En vez de solo "us"
    (Continúa con las demás opciones Xkb)
EndSection

Nota: El cambio recién visto solo se requiere en caso de usar un mapa de teclado norteamericano u otro mapa donde las teclas muertas parecen no funcionar. Los usuarios europeos deben tener sus teclas muertas funcionando sin más.

Este cambio hará efecto al reiniciar el servidor X. Para aplicar el cambio en seguida, use la herramienta setxkbmap, así setxkbmap en_US.

Probablemente sea más fácil describir el uso de teclas muertas con ejemplos. Aunque los resultados dependen de la localización del sistema, los conceptos son iguales, sin importar la localización. Los ejemplos contienen UTF-8, así que para verlos, debe configurar su navegador para ver la página como UTF-8, o tener su localización UTF-8 ya configurada.

Si pulsamos AltGr y [ a la vez, los soltamos y luego pulsamos a, producimos una 'ä'. Si pulsamos AltGr y [ al mismo tiempo y luego pulsamos e, producimos una 'ë'. Al pulsar AltGr y ; a la vez, producimos una 'á' y cuando pulsamos AltGr y ; a la vez, los soltamos y pulsamos la e, producimos una 'é'.

Si pulsamos AltGr, Shift y [ a la vez, los soltamos y luego pulsamos una a, podemos producir una 'å' escandinava. Similarmente, al pulsar AltGr, Shift y [ al mismo tiempo, soltamos solamente la [ y luego al pulsarla otra vez, producimos una '˚'. Aunque lo parezca, este caracter (U+02DA) no es el símbolo de grados (U+00B0). Esto funciona para los demás acentos producidos por las teclas muertas — AltGr y [, soltando solo la tecla [ y pulsándolo de nuevo hace una '¨'.

AltGr puede ser usado con las teclas alfabéticas solas. Por ejemplo una AltGr y una m producen una mu griega en minúscula: 'µ'. AltGr y una s producen un 'scharfes s' también conocida como 'esszet', así: 'ß'. Como es de esperarse por parte de muchos usuarios europeos (porque está marcado en su teclado), AltGr y 4 (o E, dependiendo del teclado) producen un signo de Euro, '€'.

Recursos



Imprimir

Actualizado 17 de abril, 2007

Sumario: Esta guía muestra cómo configurar y utilizar el conjunto de caracteres UTF-8 con su sistema Gentoo Linux, luego de explicar los beneficios de Unicode en general y de UTF-8 en específico.

Thomas Martin
Author

Alexander Simonov
Contribuidor

Shyam Mani
Editor

John Christian Stoddart
Traductor

José Luis Rivero
Traductor

Donate to support our development efforts.

Support OSL

Support OSL

Gentoo Centric Hosting: vr.org

VR Hosted

Tek Alchemy

Tek Alchemy

SevenL.net

SevenL.net

Global Netoptex Inc.

Global Netoptex Inc.

Linux World Expo

Linux World Expo

Copyright 2001-2008 Gentoo Foundation, Inc. Questions, Comments? Contact us.