Gentoo Logo

Utilitzant UTF-8 amb Gentoo

Contingut:

1.  Codificacions de Caràcters

Què és una Codificació de Caràcter?

Els ordinadors no entenen per ells mateixos el text. En canvi, cada caràcter és representat per un número. Tradicionalment, cada joc de nombres que es feia servir per representar l'alfabet i caràcters (coneguts com a codis de sistema, codificació o joc de caràcters) estava limitat per la mida degut a les limitacions en el maquinari dels ordinadors.

La Història de les Codificacions de Caràcters

El joc de caràcters més comú (o com a mínim el més àmpliament acceptat) és l'ASCII (Estàndard de Codificació Americana per a l'Intercanvi de Informació). És àmpliament sostingut que l'ASCII és l'estàndard de programari més reeixit de tots els temps. L'ASCII Modern va ser estandarditzat al 1986 (ANSI X3.4, RFC 20, ISO/IEC 646:1991, ECMA-6) per l'Institut Nacional Americà d'Estàndards.

L'ASCII és estrictament de set bits, amb això vol dir que utilitza patrons de bits representables amb set dígits binaris, amb això tenim un rang de 0 a 127 en decimal. Això inclou 32 caràcters de control no visibles, la majoria entre 0 i 31, amb el caràcter de control final, DEL o eliminar a la posició 127. Els caràcters del 32 a 126 són caràcters visibles: un espai, marques de puntuació, lletres llatines i nombres.

El vuitè bit en ASCII es feia servir originalment com a bit de paritat per comprovació d'errors. Si això no es desitja, es deixa a 0. Això vol dir que, amb l'ASCII, cada caràcter és representa amb un sol byte.

Encara que amb l'ASCII en teniu prou per comunicar-vos en Anglès modern, en altres llengües europees que inclouen caràcters accentuats, les coses no són tan fàcils. L'estàndard ISO 8859 es va desenvolupar per recollir aquestes necessitats. Eren compatibles endarrere amb l'ASCII, però enlloc de deixar el vuitè bit en blanc, l'utilitzaven per permetre 127 caràcters en cada codificació. Les limitacions del ISO 8859 de seguida es van sortir a la llum, i actualment hi ha 15 variants de l'estàndard ISO 8859 (del 8859-1 al 8859-15). Fora del rang del byte compatible amb l'ASCII, a vegades hi ha conflictes entre les lletres representades per aquests jocs de caràcters. Per complicar encara més la interoperabilitat entre les codificacions de caràcters, en algunes versions del Microsoft Windows és fa servir la Windows-1252 enlloc dels idiomes occidentals europeus. Aquest és un supra joc del ISO 8859-1, tot i així és diferent de moltes maneres. Aquests jocs, tot i així, tenen una compatibilitat plena amb l'ASCII.

El desenvolupament necessari de codificacions d'un sol byte completament diferents per als alfabets no llatins, com l'EUC (Codificació Unix Estesa) que es fa servir pel Japonès i el Coreà (i per a una extensió menor del Xinés) va crear més confusió, mentre altres sistemes operatius encara fan servir diferents jocs de caràcters per el mateix idioma, per exemple, Shift-JIS i ISO-2022-JP. Els usuaris que vulguin veure caràcters ciríl·lics han de triar entre KOI8-R pel Rus i Búlgar o KOI8-U per l'Ucraïnès, com també totes les altres codificacions ciríl·liques com la desafortunada ISO 8859-5, i el joc comú Windows-1251. Tots aquests jocs de caràcters trenquen bona part de la compatibilitat amb l'ASCII (tot i que les codificacions KOI8 situen els caràcters ciríl·lics en ordre llatí, així en cas que el vuitè bit sigui tret, el text encara és desxifrable en un terminal ASCII a través d'una transliteració reservada a casos.)

Això ha portat a confusió, i pràcticament a una impossibilitat de comunicacions multilingüistes, especialment entre diferents alfabets. Entrem a l'Unicode.

Què és l'Unicode?

L'Unicode llença la limitació a un sol byte dels jocs de caràcter tradicionals. Utilitza 17 "planes" de 65,536 punts de codi per descriure un màxim de 1,114,112 caràcters. La primera pàgina, més coneguda com a "Plana Bàsica Multilingüe" o BMP, conté pràcticament tot el que fareu servir mai, molts han fet la falsa afirmació que l'Unicode era un joc de caràcters de 16 bits.

L'Unicode s'ha mapejat de moltes maneres diferents, però les dues més comunes són l'UTF (Format de Transformació Unicode) i l'UCS (Joc de Caràcters Universal). Un nombre després de UTF indica el nombre de bits en una unitat, mentre que un nombre després de UCS indica el nombre de bytes. UTF-8 s'ha convertit en el utilitzat en l'intercanvi de text Unicode degut a la seva naturalesa de vuit bits, i és l'assumpte d'aquest document.

UTF-8

L'UTF-8 és una codificació de caràcters de llargada variable, que vol dir que pot fer servir de 1 a 4 bytes per símbol. Així, el primer byte UTF-8 es fa servir per la codificació de l'ASCII, donant-li al joc de caràcters compatibilitat completa amb l'ASCII. L'UTF-8 vol dir que els caràcters ASCII o llatins són intercanviables amb un petit increment de la mida de les dades, perquè només es fa servir el primer bit. Usuaris de alfabets orientals com el Japonès, que se'ls ha assignat un rang de byte més alt són més infeliços, ja que com a resultat tenen un 50% més de redundància en les seves dades.

Què Pot Fer l'UTF-8 Per Tu

L'UTF-8 li permet treballar en un entorn multilingüe que compleix els estàndards i internacionalment acceptat, amb, comparativament, una baixa redundància de dades. L'UTF-8 és la forma preferida per transmetre caràcters no ASCII a través de Internet, per correu electrònic, IRC o gairebé qualsevol medi. Malgrat això, molta gent considera abusiu l'UTF-8 en les comunicacions en línia. Sempre és millor tenir en compte l'actitud respecte l'UTF-8 en un canal específic, llista de correu o grup Usenet abans d'utilitzar UTF-8 no ASCII.

2.  Configurant Gentoo Linux amb UTF-8

Cercant o Creant Locals UTF-8

Ara que enteneu els principis darrere l'Unicode, esteu apunt per començar a utilitzar l'UTF-8 en el vostre sistema.

El requisit preliminar per l'UTF-8 és tenir una versió instal·lada de la la glibc que tingui suport per a idiomes nacionals. La manera recomanada per fer-ho és a través del fitxer /etc/locales.build amb combinació amb la opció userlocales de la variable USE. Està per sota de l'objectiu d'aquest document explicar l'utilització d'aquest fitxer, esperem i confiem que l'utilització d'aquest fitxer està prou ben documentat en els seus propis comentaris. A més també està explicat en la Guia de Localització de Gentoo.

Seguidament, necessitem decidir si ja hi ha disponible un localisme del nostre idioma apunt per UTF-8, o bé, n'hem de crear un.

Llistat de Codi 2.1: Comprovant si ja existeix un localisme amb UTF-8

(Reemplaceu "en_GB" amb el local que desitgeu)
# locale -a | grep 'en_GB'
en_GB
en_GB.UTF-8

De la sortida d'aquesta ordre d'execució, hem d'agafara el resultat que contingui un sufix semblant a .UTF-8. Si no hi ha cap resultat amb un sufix semblant a .UTF-8, haurem de crear un local compatible amb UTF-8.

Nota: Executeu només aquesta ordre d'execució llistada si no teniu un local amb UTF-8 disponible pel vostre idioma.

Llistat de Codi 2.2: Creant un local amb UTF-8

(Reemplaceu "en_GB" amb el local que desitgeu)
# localedef -i en_GB -f UTF-8 en_GB.UTF-8

Una altre manera d'incloure un local amb UTF-8 és afegint-lo al fitxer /etc/locales.build i reconstruir la glibc amb la opció userlocales definida a la variable USE.

Llistat de Codi 2.3: Línia a /etc/locales.build

en_GB.UTF-8/UTF-8

Paràmetres del Local

Hi ha una variable d'entorn que es necessita configurar per poder utilitzar el nous locals UTF-8: LC_ALL (aquesta variable també sobreescriu el paràmetre LANG). Hi ha moltes maneres de configurar-ho; algunes persones prefereixen tenir un entorn UTF-8 per a un usuari específic, així que la configuren en el seu ~/.profile (si feu servir /bin/sh), ~/.bash_profile o ~/.bashrc (si feu servir /bin/bash).

Altres prefereixen configurar el local globalment. Una circumstància específica que l'autor recomana en particular és quan es fa servir /etc/init.d/xdm, perquè aquest script d'inici engega el gestor de pantalla i l'escriptori abans de que qualsevol dels anteriorment mencionats fitxers d'inici són utilitzats, i per tan abans de que qualsevol variable estigui en l'entorn.

Per configurar el local globalment s'hauria de fer fent servir /etc/env.d/02locale. El fitxer hauria de semblar-se a el següent:

Llistat de Codi 2.4: Demostració del /etc/env.d/02locale

(Com sempre, canvieu "en_GB.UTF-8" pel seu local)
LC_ALL="en_GB.UTF-8"

El següent pas és actualitzar l'entorn amb el canvi.

Llistat de Codi 2.5: Actualitzant l'entorn

# env-update
>>> Regenerating /etc/ld.so.cache...
 * Caching service dependencies ...
# source /etc/profile

Executi locale sense arguments per veure si el valor de les variables és correcte en el nostre entorn:

Llistat de Codi 2.6: Comprovant si el nostre local nou està en l'entorn

# locale
LANG=
LC_CTYPE="en_GB.UTF-8"
LC_NUMERIC="en_GB.UTF-8"
LC_TIME="en_GB.UTF-8"
LC_COLLATE="en_GB.UTF-8"
LC_MONETARY="en_GB.UTF-8"
LC_MESSAGES="en_GB.UTF-8"
LC_PAPER="en_GB.UTF-8"
LC_NAME="en_GB.UTF-8"
LC_ADDRESS="en_GB.UTF-8"
LC_TELEPHONE="en_GB.UTF-8"
LC_MEASUREMENT="en_GB.UTF-8"
LC_IDENTIFICATION="en_GB.UTF-8"
LC_ALL=en_GB.UTF-8

Això és tot. Ja esteu fent servir locals UTF-8, el següent obstacle és configurar les aplicacions d'ús diari.

3.  Suport de les Aplicacions

Quan l'Unicode va començar a guanyar impuls en el món del programari, els jocs de caràcters de múltiples bytes no encaixaven gaire bé amb llenguatges com el C, llenguatge emprat per molts dels programes utilitzats a diari. Encara avui, hi ha programes que encara no gestionen bé l'UTF-8. Per sort, molt sí!

Noms de Fitxers, NTFS, i FAT

Hi ha moltes opcions de NLS el en menú de configuració del kernel Linux, però és important no confondre's! La gran majoria, l'única cosa que hauran de fer és construir el suport NLS de UTF-8 en el seu kernel, i canviar l'opció per defecte del NLS a utf8.

Llistat de Codi 3.1: Passos de configuració del Kernel per a NLS UTF-8

File Systems -->
  Native Language Support -->
    (utf8) Default NLS Option
    <*> NLS UTF8
    (També <*> altres jocs de caràcters que es fan servir en 
    el vostre sistema de fitxers FAT o CD-ROMs Joilet.)

Si penseu montar particions NTFS, necessitareu especificar la opció nls= amb mount. Si penseu montar particions FAT, necessitareu especificar la opció codepage= amb mount. Opcionalment, també podeu posar un codepage per defecte pel FAT en la configuració del kernel. Adoneu-vos que la opció codepage al montar sobreescriurà la configuració del kernel.

Llistat de Codi 3.2: Paràmetres del FAT en la configuració del kernel

File Systems -->
  DOS/FAT/NT Filesystems  -->
    (437) Default codepage for fat

Hauríeu d'evitar posar el paràmetre Default iocharset for fat a UTF-8, ja que no es recomana. Enlloc seu, podríeu passar la opció utf8=true al montar la vostre partició FAT. Per a més informació, mireu man mount i la documentació del kernel a /usr/src/linux/Documentation/filesystems/vfat.txt.

Per canviar la codificació dels noms de fitxers, podeu fer servir app-text/convmv.

Llistat de Codi 3.3: Exemple d'ús del convmv

# emerge --ask app-text/convmv
(Format de l'ordre d'execució)
# convmv -f <codificació actual> -t utf-8 <nom del fitxer>
(Canvieu iso-8859-1 pel joc de caràcters del que esteu 
convertint)
# convmv -f iso-8859-1 -t utf-8 filename

Per canviar el contingut dels fitxers, feu servir la utilitat iconv, inclosa amb la glibc:

Llistat de Codi 3.4: Exemple d'ús de l'iconv

(canvieu iso-8859-1 amb el joc de caràcters del que esteu 
convertint)
(Comproveu que la sortida és correcte)
# iconv -f iso-8859-1 -t utf-8 filename 
(Per convertir un fitxer, heu de crear-ne un altre)
# iconv -f iso-8859-1 -t utf-8 filename > newfile

També es pot fer servir app-text/recode pel mateix propòsit.

La Cònsola del Sistema

Important: Per tenir Unicode en la cònsola necessiteu >=sys-apps/baselayout-1.11.9.

Per habilitar l'UTF-8 en la cònsola, haureu d'editar /etc/rc.conf i establir UNICODE="yes", també llegiu els comentaris d'aquest fitxer -- és important tenir un tipus de lletra que tingui un bon rang de caràcters si teniu pensat en fer servir gran part de l'Unicode.

La variable KEYMAP, especificada a /etc/conf.d/keymaps, hauria de tenir un keymap Unicode.

Llistat de Codi 3.5: Exemple de /etc/conf.d/keymaps, un retall

(Canvieu "uk" per la vostre presentació local)
KEYMAP="uk"

Ncurses i Slang

Nota: Ignoreu tota menció a Slang en aquesta secció si no el teniu instal·lat o no el feu servir.

És recomanable afegir unicode a la vostre variable global USE a /etc/make.conf, i seguidament fer un remerge de sys-libs/ncurses i sys-libs/slang si s'escau. El Portage ho farà automàticament quan actualitzeu el vostre sistema:

Llistat de Codi 3.6: Actualitzant el vostre sistema

# emerge --update --deep --newuse world

Ara que els canvis s'han aplicat, també hem de reconstruir els paquets que s'enllacen a aquests. L'eina que farem servir (revdep-rebuild) forma part del paquet gentoolkit.

Llistat de Codi 3.7: Reconstruint els programes que enllacen a ncurses o slang

# revdep-rebuild --soname libncurses.so.5
# revdep-rebuild --soname libslang.so.1

KDE, GNOME i Xfce

Tots els grans entorns d'escriptori tenen ple suport per Unicode, i no necessitaran més configuracions de les que ja ha cobert aquesta guia. Això és perquè el joc d'eines gràfic que corre per sota (Qt o GTK+2) són conscients de l'UTF-8. Conseqüentment, totes les aplicacions construïdes sobre aquests jocs d'eines haurien de ser conscients de l'UTF-8 directament.

L'excepció a aquesta regla ve de les Xlib i el GTK+1. El GTK+1 necessita un FontSpec iso-10646-1 a ~/.gtkrc, per exemple -misc-fixed-*-*-*-*-*-*-*-*-*-*-iso10646-1. A més, les aplicacions que facin servir Xlib o Waw necessitaran una FontSpec semblant, si no és així no funcionaran.

Nota: Si teniu alguna versió del centre de control del gnome1 per algun lloc, feu-lo servir en el seu lloc. Agafeu qualsevol tipus de lletra iso10646-1 d'allà.

Llistat de Codi 3.8: Exemple de ~/.gtkrc (per GTK+1) que defineix un tipus de lletra compatible amb UTF-8

style "user-font"
{
    fontset="-misc-fixed-*-*-*-*-*-*-*-*-*-*-iso10646-1"
}
widget_class "*" style "user-font"

Si una aplicació té suport tant per Qt com GTK+2 GUI, la GTK+2 GUI donarà en general un millor resultat amb Unicode.

X11 i Tipus de lletres

Important: L'x11-base/xorg-x11 té un millor suport per l'Unicode que l'XFree86 i és molt recomanable.

Els tipus de lletra TrueType tenen suport per l'Unicode, i molts dels tipus de lletra que venen amb les Xorg tenen un gran suport de caràcters, tot i així, òbviament, no tots i cadascun dels símbols disponibles a l'Unicode s'han creat per aquell tipus de lletra. Per construir tipus de lletra (inclòs el joc Bitstream Vera) per les X amb suport per a lletres de l'est asiàtic, assegureu-vos de que teniu a la variable USE la opció cjk. Moltes altres aplicacions fan servir aquesta opció, per tant seria una bona idea deixar-la com a opció permanent a la variable USE.

També, molts altres paquets de tipus de lletra del Portage suporten l'Unicode.

Llistat de Codi 3.9: Opcional: Instal·lar alguns tipus de lletra més amb suport per Unicode

# emerge terminus-font intlfonts freefonts cronyx-fonts corefonts

Gestors de Finestres i Emuladors de Terminal

Els gestors de finestres que no estan construïts sobre GTK o Qt generalment tenen molt bon suport per Unicode, ja que normalment fan servir la llibreria Xft per gestionar els tipus de lletres. Si el vostre gestor de finestres no fa servir l'Xft pels tipus de lletra, encara podeu fer servir el FontSpec mencionat en la secció anterior com a tipus de lletra Unicode.

Els emuladors de terminal que fan servir Xft i tenen suport per Unicode són més difícils de trobar. Apart del Konsole i el gnome-terminal, les millors opcions al Portage són x11-terms/rxvt-unicode, xfce-extra/terminal, gnustep-apps/terminal, x11-terms/mlterm, o elx11-terms/xterm pelat quan es construeix amb la opció unicode a la variable USE si s'invoca com a uxterm. L'app-misc/screen també suporta l'UTF-8, quan s'invoca com a screen -U o es posa a ~/.screenrc el següent:

Llistat de Codi 3.10: ~/.screenrc per a UTF-8

defutf8 on

Vim, Emacs, Xemacs i Nano

El Vim proporciona ple suport per UTF-8, i també té incorporada la detecció de fitxers UTF-8. Per a més informació sobre el Vim, feu servir :help mbyte.txt.

L'Emacs 22.x i les versions superiors també tenen ple suport de UTF-8. L'Xemacs 22.x encara no suporta la combinació de caràcters.

Versions anteriors de Emacs i/o Xemacs podrien demanar-li d'instal·lar app-emacs/mule-ucs i/o app-xemacs/mule-ucs i afegir el següent codi al vostre ~/.emacs per donar suport a idiomes CJK amb UTF-8:

Llistat de Codi 3.11: Suport a l'Emacs per a CJK amb UTF-8

(require 'un-define)
(require 'jisx0213)
(set-language-environment "Japanese")
(set-default-coding-systems 'utf-8)
(set-terminal-coding-system 'utf-8)

El Nano dóna ple suport a UTF-8 des de la versió 1.3.6.

Intèrprets d'ordres

Actualment, el bash dóna ple suport al Unicode a través de la llibreria GNU readline. Els usuaris de Z Shell estan en una posició pitjor -- no hi ha cap part de l'intèrpret d'ordres amb suport per a Unicode, tot i que hi ha un esforç decidit d'afegir suport per a jocs de caràcter de múltiples bytes en aquests moments.

Els intèrprets d'ordres C shell, tcsh i ksh no tenen cap mena de suport per a UTF-8.

Irssi

L'Irssi té un ple suport per a UTF-8, tot i que és necessari que l'usuari configuri la opció.

Llistat de Codi 3.12: Habilitant l'UTF-8 al Irssi

/set term_charset UTF-8

En canals on caràcters no ASCII s'intercanvien sovint amb jocs de caràcters no UTF-8, es pot fer servir la comanda /recode per convertir els caràcters. Per a més informació escriviu /help recode.

Mutt

L'agent de correu Mutt té un molt bon suport per a Unicode. Per fer servir l'UTF-8 en el Mutt, no heu de posar res als vostres fitxers de configuració. El Mutt funcionarà en un entorn unicode sense modificar-lo si tots els vostres fitxers de configuració (inclosa la signatura) estan codificats amb UTF-8.

Nota: Llegint correus amb el Mutt encara podríeu veure '?'. Això passa perquè hi ha persones que el seu client de correu no indica el joc de caràcters. No hi podeu fer massa aquí apart de demanar-los que configurin correctament el seu client.

Teniu més informació disponible al Wiki del Mutt.

Less

Tots fem servir moltes vegades more o less amb | per veure correctament la sortida d'una ordre, com per exemple dmesg | less. Mentre que pel more només necessitem que l'intèrpret d'ordres estigui al cas de l'UTF-8, el less necessita que estigui assignada la variable d'entorn LESSCHARSET, per assegurar-nos que els caràcters unicode són rendertitzats correctament. Això es pot indicar a /etc/profile o ~/.bash_profile. Engegueu el vostre editor preferit i afegiu la següent línia a algun dels fitxers abans mencionats.

Llistat de Codi 3.13: Configurant la variable d'entorn per al less

LESSCHARSET=utf-8

Man

Les pàgines Man són una part integral de qualsevol màquina Linux. Per assegurar-nos de que qualsevol unicode en les pàgines man es renderitza correctament, editeu /etc/man.conf i reemplaceu una línia tal com es mostra aquí sota.

Llistat de Codi 3.14: Canvis al man.conf per donar suport a UTF-8

(Aquesta és la línia vella)
NROFF           /usr/bin/nroff -Tascii -c -mandoc
(Reemplaceu el d'aquí sobre per això)
NROFF           /usr/bin/nroff -mandoc -c

elinks i links

Són dos navegadors en mode text comuns, i hauríem de veure com se'ls pot habilitar el suport per UTF-8. A l'elinks i links, hi ha dues maneres de fer-ho, una és utilitzant la opció de configuració del propi navegador o editant el fitxer de configuració. Per fer-ho des del navegador, obriu un lloc web amb l'elinks o el links i llavors premeu Alt+S per entrar al menú de configuració, tot seguit seleccioneu les opcions del terminal, o premeu T. Baixeu i seleccioneu l'última opció, UTF-8 I/O, prement Retorn. Seguidament salveu i sortiu del menú. En el links hauríeu de fer dues vegades Alt+S per tot seguit prémer S per desar. La opció del fitxer de configuració es mostra aquí sota.

Llistat de Codi 3.15: Habilitant l'UTF-8 pel elinks/links

(Per l'elinks, editeu /etc/elinks/elinks.conf o ~/.elinks/elinks.conf 
i afegiu la següent línia)
set terminal.linux.utf_8_io = 1

(Pel links, editeu ~/.links/links.cfg i afegiu la següent línia)
terminal "xterm" 0 1 0 us-ascii utf-8

Provant-ho tot

Hi ha molts llocs webs amb tests de UTF-8. net-www/w3m, net-www/links, net-www/elinks, net-www/lynx i tots els navegadors basats en Mozilla (inclòs el Firefox) suporten UTF-8. També tenen ple suport per a UTF-8 el Konqueror i l'Opera.

Quan utilitzeu un navegador web en mode text, assegureu-vos del tot que feu servir un terminal amb Unicode.

Si veieu alguns caràcters que es mostren com a caixes amb lletres o nombres a dintre, vol dir que el vostre tipus de lletra no té un símbol pel caràcter que l'UTF-8 vol. En lloc seu, mostra una caixa amb el codi hexadecimal del símbol UTF-8.

Mètodes d'entrada

Per incloure caràcters a les X que no estan en el vostre teclat podríeu fer servir tecles mortes. Funciona prement alhora la vostre tecla Alt de la dreta (o en alguns països AltGr) i una tecla opcional de la secció no alfabètica del teclat que quedi a l'esquerre de la tecla Retorn, alliberant-los i seguidament prémer una tecla. La tecla morta hauria de modificar-ho. L'entrada pot ser modificada després utilitzant la tecla Shift al mateix moment que es prem la tecla AltGr i la modificadora.

Per habilitar les tecles mortes a les X, necessiteu una presentació que ho suporti. La majoria de presentacions europees tenen tecles mortes amb les variants per defecte. Tot i així, això no és cert per les presentacions d'Amèrica del Nord. Encara que hi ha un grau de inconsistència entre presentacions, la solució més fàcil sembla ser la d'utilitzar presentacions de l'estil "en_US" millor que "us", per exemple. La presentació és configura a /etc/X11/xorg.conf semblant a:

Llistat de Codi 3.16: retall de /etc/X11/xorg.conf

Section "InputDevice"
    Identifier "Keyboard0"
    Driver     "kbd"
    Option     "XkbLayout" "en_US" # Millor que només "us"
    (Altres opcions del Xkb aquí)
EndSection

Nota: Els canvis anteriors només es necessiten aplicar si està utilitzant una presentació d'Amèrica del Nord, o alguna altre presentació en que les tecles mortes sembli que no funcionen. Els usuaris europeus ja haurien de tenir funcionant les tecles mortes.

L'efecte d'aquest canvi es notarà quan reinicieu el servidor de les X. Per aplicar aquest canvi de seguida, utilitzeu l'eina setxkbmap, per exemple, setxkbmap en_US.

Segurament és més fàcil descriure les tecles mortes amb exemples, Tot i així els resultats depenen del local, els conceptes es mantindran iguals tot i el local. Els exemples contenen UTF-8, per tan per veure-ho necessitareu dir-li al vostre navegador que visualitzi la pàgina amb UTF-8, o tenir algun local ja configurat amb UTF-8.

Quan premo AltGr i [ al mateix moment, les allibero i seguidament premo a, es produeix 'ä'. Quan premo AltGr i [ al mateix moment, les allibero i seguidament premo e, es produeix 'ë'. Quan premo AltGr i ; al mateix moment, es produeix 'á', i quan premo AltGr i ; al mateix moment, les allibero i seguidament premo e, es produeix 'é'.

Prement AltGr, Shift i [ a la vegada, alliberant-les, i seguidament prement a, es produeix la a escandinava 'å'. De la mateixa manera, prement AltGr, Shift i [ a la vegada, alliberant només la [, i seguidament prement-la altre cop, es produeix '˚'. Tanmateix sembla que un, aquest (U+02DA) no és el mateix que el símbol de grau (U+00B0). També funciona per altres accents produïts per tecles mortes — AltGr i [, alliberant només [, seguidament tornant-la a prémer fa '¨'.

La tecla AltGr també es pot fer servir amb tecles alfabètiques. Per exemple, AltGr i m fan la lletra grega mu amb minúscula: 'µ'. AltGr i s fan la lletra essa-zeta o scharfes: 'ß'. I com molt usuaris europeus esperen (perquè està indicat en el seu teclat), AltGr i 4 (o la E depenent de la disposició del teclat) produeixen el símbol de l'Euro, '€'.

Recursos



Imprimir

Actualitzat 19 de març, 2006

La versió original d'aquest document va ser actualitzada el 8 de març, 2011

Sumari: Aquesta guia mostra com instal·lar i utilitzar el joc de caràcters UTF-8 Unicode amb el vostre sistema Gentoo Linux, després d'explicar els beneficis de l'Unicode i més concretament de l'UTF-8.

Thomas Martin
Author

Alexander Simonov
Contributor

Shyam Mani
Editor

Gil Forcada
Traductor

Donate to support our development efforts.

Copyright 2001-2012 Gentoo Foundation, Inc. Questions, Comments? Contact us.