Utilitzant UTF-8 amb Gentoo
1.
Codificacions de Caràcters
Què és una Codificació de Caràcter?
Els ordinadors no entenen per ells mateixos el text. En canvi, cada caràcter
és representat per un número. Tradicionalment, cada joc de nombres que es
feia servir per representar l'alfabet i caràcters (coneguts com a codis de
sistema, codificació o joc de caràcters) estava limitat per la mida degut a
les limitacions en el maquinari dels ordinadors.
La Història de les Codificacions de Caràcters
El joc de caràcters més comú (o com a mínim el més àmpliament acceptat) és
l'ASCII (Estàndard de Codificació Americana per a l'Intercanvi de
Informació). És àmpliament sostingut que l'ASCII és l'estàndard de programari
més reeixit de tots els temps. L'ASCII Modern va ser estandarditzat al 1986
(ANSI X3.4, RFC 20, ISO/IEC 646:1991, ECMA-6) per l'Institut Nacional Americà
d'Estàndards.
L'ASCII és estrictament de set bits, amb això vol dir que utilitza patrons de
bits representables amb set dígits binaris, amb això tenim un rang de 0 a 127
en decimal. Això inclou 32 caràcters de control no visibles, la majoria entre
0 i 31, amb el caràcter de control final, DEL o eliminar a la posició 127. Els
caràcters del 32 a 126 són caràcters visibles: un espai, marques de puntuació,
lletres llatines i nombres.
El vuitè bit en ASCII es feia servir originalment com a bit de paritat per
comprovació d'errors. Si això no es desitja, es deixa a 0. Això vol dir que,
amb l'ASCII, cada caràcter és representa amb un sol byte.
Encara que amb l'ASCII en teniu prou per comunicar-vos en Anglès modern, en
altres llengües europees que inclouen caràcters accentuats, les coses no són
tan fàcils. L'estàndard ISO 8859 es va desenvolupar per recollir aquestes
necessitats. Eren compatibles endarrere amb l'ASCII, però enlloc de deixar el
vuitè bit en blanc, l'utilitzaven per permetre 127 caràcters en cada
codificació. Les limitacions del ISO 8859 de seguida es van sortir a la llum,
i actualment hi ha 15 variants de l'estàndard ISO 8859 (del 8859-1 al
8859-15). Fora del rang del byte compatible amb l'ASCII, a vegades hi ha
conflictes entre les lletres representades per aquests jocs de caràcters. Per
complicar encara més la interoperabilitat entre les codificacions de
caràcters, en algunes versions del Microsoft Windows és fa servir la
Windows-1252 enlloc dels idiomes occidentals europeus. Aquest és un supra joc
del ISO 8859-1, tot i així és diferent de moltes maneres. Aquests jocs, tot i
així, tenen una compatibilitat plena amb l'ASCII.
El desenvolupament necessari de codificacions d'un sol byte completament
diferents per als alfabets no llatins, com l'EUC (Codificació Unix Estesa) que
es fa servir pel Japonès i el Coreà (i per a una extensió menor del Xinés) va
crear més confusió, mentre altres sistemes operatius encara fan servir
diferents jocs de caràcters per el mateix idioma, per exemple, Shift-JIS i
ISO-2022-JP. Els usuaris que vulguin veure caràcters ciríl·lics han de triar
entre KOI8-R pel Rus i Búlgar o KOI8-U per l'Ucraïnès, com també totes les
altres codificacions ciríl·liques com la desafortunada ISO 8859-5, i el joc
comú Windows-1251. Tots aquests jocs de caràcters trenquen bona part de la
compatibilitat amb l'ASCII (tot i que les codificacions KOI8 situen els
caràcters ciríl·lics en ordre llatí, així en cas que el vuitè bit sigui
tret, el text encara és desxifrable en un terminal ASCII a través d'una
transliteració reservada a casos.)
Això ha portat a confusió, i pràcticament a una impossibilitat de
comunicacions multilingüistes, especialment entre diferents alfabets. Entrem
a l'Unicode.
Què és l'Unicode?
L'Unicode llença la limitació a un sol byte dels jocs de caràcter
tradicionals. Utilitza 17 "planes" de 65,536 punts de codi per descriure un
màxim de 1,114,112 caràcters. La primera pàgina, més coneguda com a "Plana
Bàsica Multilingüe" o BMP, conté pràcticament tot el que fareu servir mai,
molts han fet la falsa afirmació que l'Unicode era un joc de caràcters de 16
bits.
L'Unicode s'ha mapejat de moltes maneres diferents, però les dues més comunes
són l'UTF (Format de Transformació Unicode) i l'UCS (Joc de
Caràcters Universal). Un nombre després de UTF indica el nombre de bits en una
unitat, mentre que un nombre després de UCS indica el nombre de bytes. UTF-8
s'ha convertit en el utilitzat en l'intercanvi de text Unicode degut a la seva
naturalesa de vuit bits, i és l'assumpte d'aquest document.
UTF-8
L'UTF-8 és una codificació de caràcters de llargada variable, que vol dir que
pot fer servir de 1 a 4 bytes per símbol. Així, el primer byte UTF-8 es fa
servir per la codificació de l'ASCII, donant-li al joc de caràcters
compatibilitat completa amb l'ASCII. L'UTF-8 vol dir que els caràcters ASCII o
llatins són intercanviables amb un petit increment de la mida de les dades,
perquè només es fa servir el primer bit. Usuaris de alfabets orientals com el
Japonès, que se'ls ha assignat un rang de byte més alt són més infeliços, ja
que com a resultat tenen un 50% més de redundància en les seves dades.
Què Pot Fer l'UTF-8 Per Tu
L'UTF-8 li permet treballar en un entorn multilingüe que compleix els
estàndards i internacionalment acceptat, amb, comparativament, una baixa
redundància de dades. L'UTF-8 és la forma preferida per transmetre caràcters
no ASCII a través de Internet, per correu electrònic, IRC o gairebé qualsevol
medi. Malgrat això, molta gent considera abusiu l'UTF-8 en les comunicacions
en línia. Sempre és millor tenir en compte l'actitud respecte l'UTF-8 en un
canal específic, llista de correu o grup Usenet abans d'utilitzar UTF-8 no
ASCII.
2.
Configurant Gentoo Linux amb UTF-8
Cercant o Creant Locals UTF-8
Ara que enteneu els principis darrere l'Unicode, esteu apunt per començar a
utilitzar l'UTF-8 en el vostre sistema.
El requisit preliminar per l'UTF-8 és tenir una versió instal·lada de la
la glibc que tingui suport per a idiomes nacionals. La manera recomanada per
fer-ho és a través del fitxer /etc/locales.build amb combinació
amb la opció userlocales de la variable USE. Està per sota de
l'objectiu d'aquest document explicar l'utilització d'aquest fitxer, esperem i
confiem que l'utilització d'aquest fitxer està prou ben documentat en els seus
propis comentaris. A més també està explicat en la Guia de Localització de
Gentoo.
Seguidament, necessitem decidir si ja hi ha disponible un localisme del nostre
idioma apunt per UTF-8, o bé, n'hem de crear un.
Llistat de Codi 2.1: Comprovant si ja existeix un localisme amb UTF-8 |
# locale -a | grep 'en_GB'
en_GB
en_GB.UTF-8
|
De la sortida d'aquesta ordre d'execució, hem d'agafara el resultat que
contingui un sufix semblant a .UTF-8. Si no hi ha cap resultat amb un
sufix semblant a .UTF-8, haurem de crear un local compatible amb UTF-8.
Nota:
Executeu només aquesta ordre d'execució llistada si no teniu un local amb
UTF-8 disponible pel vostre idioma.
|
Llistat de Codi 2.2: Creant un local amb UTF-8 |
# localedef -i en_GB -f UTF-8 en_GB.UTF-8
|
Una altre manera d'incloure un local amb UTF-8 és afegint-lo al fitxer
/etc/locales.build i reconstruir la glibc amb la opció
userlocales definida a la variable USE.
Llistat de Codi 2.3: Línia a /etc/locales.build |
en_GB.UTF-8/UTF-8
|
Paràmetres del Local
Hi ha una variable d'entorn que es necessita configurar per poder utilitzar el
nous locals UTF-8: LC_ALL (aquesta variable també sobreescriu el
paràmetre LANG). Hi ha moltes maneres de configurar-ho; algunes
persones prefereixen tenir un entorn UTF-8 per a un usuari específic, així que
la configuren en el seu ~/.profile (si feu servir
/bin/sh), ~/.bash_profile o ~/.bashrc (si feu
servir /bin/bash).
Altres prefereixen configurar el local globalment. Una circumstància
específica que l'autor recomana en particular és quan es fa servir
/etc/init.d/xdm, perquè aquest script d'inici engega el gestor
de pantalla i l'escriptori abans de que qualsevol dels anteriorment mencionats
fitxers d'inici són utilitzats, i per tan abans de que qualsevol variable
estigui en l'entorn.
Per configurar el local globalment s'hauria de fer fent servir
/etc/env.d/02locale. El fitxer hauria de semblar-se a el següent:
Llistat de Codi 2.4: Demostració del /etc/env.d/02locale |
LC_ALL="en_GB.UTF-8"
|
El següent pas és actualitzar l'entorn amb el canvi.
Llistat de Codi 2.5: Actualitzant l'entorn |
# env-update
>>> Regenerating /etc/ld.so.cache...
* Caching service dependencies ...
# source /etc/profile
|
Executi locale sense arguments per veure si el valor de les variables
és correcte en el nostre entorn:
Llistat de Codi 2.6: Comprovant si el nostre local nou està en l'entorn |
# locale
LANG=
LC_CTYPE="en_GB.UTF-8"
LC_NUMERIC="en_GB.UTF-8"
LC_TIME="en_GB.UTF-8"
LC_COLLATE="en_GB.UTF-8"
LC_MONETARY="en_GB.UTF-8"
LC_MESSAGES="en_GB.UTF-8"
LC_PAPER="en_GB.UTF-8"
LC_NAME="en_GB.UTF-8"
LC_ADDRESS="en_GB.UTF-8"
LC_TELEPHONE="en_GB.UTF-8"
LC_MEASUREMENT="en_GB.UTF-8"
LC_IDENTIFICATION="en_GB.UTF-8"
LC_ALL=en_GB.UTF-8
|
Això és tot. Ja esteu fent servir locals UTF-8, el següent obstacle és
configurar les aplicacions d'ús diari.
3.
Suport de les Aplicacions
Quan l'Unicode va començar a guanyar impuls en el món del programari, els jocs
de caràcters de múltiples bytes no encaixaven gaire bé amb llenguatges com el
C, llenguatge emprat per molts dels programes utilitzats a diari. Encara avui,
hi ha programes que encara no gestionen bé l'UTF-8. Per sort, molt sí!
Noms de Fitxers, NTFS, i FAT
Hi ha moltes opcions de NLS el en menú de configuració del kernel Linux, però
és important no confondre's! La gran majoria, l'única cosa que hauran de fer
és construir el suport NLS de UTF-8 en el seu kernel, i canviar l'opció per
defecte del NLS a utf8.
Llistat de Codi 3.1: Passos de configuració del Kernel per a NLS UTF-8 |
File Systems -->
Native Language Support -->
(utf8) Default NLS Option
<*> NLS UTF8
|
Si penseu montar particions NTFS, necessitareu especificar la opció
nls= amb mount. Si penseu montar particions FAT, necessitareu
especificar la opció codepage= amb mount. Opcionalment, també podeu
posar un codepage per defecte pel FAT en la configuració del kernel.
Adoneu-vos que la opció codepage al montar sobreescriurà la
configuració del kernel.
Llistat de Codi 3.2: Paràmetres del FAT en la configuració del kernel |
File Systems -->
DOS/FAT/NT Filesystems -->
(437) Default codepage for fat
|
Hauríeu d'evitar posar el paràmetre Default iocharset for fat a UTF-8,
ja que no es recomana. Enlloc seu, podríeu passar la opció utf8=true al montar
la vostre partició FAT. Per a més informació, mireu man mount i la
documentació del kernel a
/usr/src/linux/Documentation/filesystems/vfat.txt.
Per canviar la codificació dels noms de fitxers, podeu fer servir
app-text/convmv.
Llistat de Codi 3.3: Exemple d'ús del convmv |
# emerge --ask app-text/convmv
# convmv -f <codificació actual> -t utf-8 <nom del fitxer>
# convmv -f iso-8859-1 -t utf-8 filename
|
Per canviar el contingut dels fitxers, feu servir la utilitat
iconv, inclosa amb la glibc:
Llistat de Codi 3.4: Exemple d'ús de l'iconv |
# iconv -f iso-8859-1 -t utf-8 filename
# iconv -f iso-8859-1 -t utf-8 filename > newfile
|
També es pot fer servir app-text/recode pel mateix propòsit.
La Cònsola del Sistema
Important:
Per tenir Unicode en la cònsola necessiteu >=sys-apps/baselayout-1.11.9.
|
Per habilitar l'UTF-8 en la cònsola, haureu d'editar /etc/rc.conf i
establir UNICODE="yes", també llegiu els comentaris d'aquest fitxer --
és important tenir un tipus de lletra que tingui un bon rang de caràcters si
teniu pensat en fer servir gran part de l'Unicode.
La variable KEYMAP, especificada a /etc/conf.d/keymaps,
hauria de tenir un keymap Unicode.
Llistat de Codi 3.5: Exemple de /etc/conf.d/keymaps, un retall |
KEYMAP="uk"
|
Ncurses i Slang
Nota:
Ignoreu tota menció a Slang en aquesta secció si no el teniu instal·lat o no
el feu servir.
|
És recomanable afegir unicode a la vostre variable global USE a
/etc/make.conf, i seguidament fer un remerge de
sys-libs/ncurses i sys-libs/slang si s'escau. El Portage ho farà
automàticament quan actualitzeu el vostre sistema:
Llistat de Codi 3.6: Actualitzant el vostre sistema |
# emerge --update --deep --newuse world
|
Ara que els canvis s'han aplicat, també hem de reconstruir els paquets que
s'enllacen a aquests. L'eina que farem servir (revdep-rebuild) forma
part del paquet gentoolkit.
Llistat de Codi 3.7: Reconstruint els programes que enllacen a ncurses o slang |
# revdep-rebuild --soname libncurses.so.5
# revdep-rebuild --soname libslang.so.1
|
KDE, GNOME i Xfce
Tots els grans entorns d'escriptori tenen ple suport per Unicode, i no
necessitaran més configuracions de les que ja ha cobert aquesta guia. Això és
perquè el joc d'eines gràfic que corre per sota (Qt o GTK+2) són conscients de
l'UTF-8. Conseqüentment, totes les aplicacions construïdes sobre aquests jocs
d'eines haurien de ser conscients de l'UTF-8 directament.
L'excepció a aquesta regla ve de les Xlib i el GTK+1. El GTK+1 necessita un
FontSpec iso-10646-1 a ~/.gtkrc, per exemple
-misc-fixed-*-*-*-*-*-*-*-*-*-*-iso10646-1. A més, les aplicacions que
facin servir Xlib o Waw necessitaran una FontSpec semblant, si no és així no
funcionaran.
Nota:
Si teniu alguna versió del centre de control del gnome1 per algun lloc,
feu-lo servir en el seu lloc. Agafeu qualsevol tipus de lletra iso10646-1
d'allà.
|
Llistat de Codi 3.8: Exemple de ~/.gtkrc (per GTK+1) que defineix un tipus de lletra compatible amb UTF-8 |
style "user-font"
{
fontset="-misc-fixed-*-*-*-*-*-*-*-*-*-*-iso10646-1"
}
widget_class "*" style "user-font"
|
Si una aplicació té suport tant per Qt com GTK+2 GUI, la GTK+2 GUI donarà en
general un millor resultat amb Unicode.
X11 i Tipus de lletres
Important:
L'x11-base/xorg-x11 té un millor suport per l'Unicode que l'XFree86 i
és molt recomanable.
|
Els tipus de lletra TrueType tenen suport per l'Unicode, i molts dels tipus de
lletra que venen amb les Xorg tenen un gran suport de caràcters, tot i així,
òbviament, no tots i cadascun dels símbols disponibles a l'Unicode s'han creat
per aquell tipus de lletra. Per construir tipus de lletra (inclòs el joc
Bitstream Vera) per les X amb suport per a lletres de l'est asiàtic,
assegureu-vos de que teniu a la variable USE la opció cjk. Moltes
altres aplicacions fan servir aquesta opció, per tant seria una bona idea
deixar-la com a opció permanent a la variable USE.
També, molts altres paquets de tipus de lletra del Portage suporten l'Unicode.
Llistat de Codi 3.9: Opcional: Instal·lar alguns tipus de lletra més amb suport per Unicode |
# emerge terminus-font intlfonts freefonts cronyx-fonts corefonts
|
Gestors de Finestres i Emuladors de Terminal
Els gestors de finestres que no estan construïts sobre GTK o Qt generalment
tenen molt bon suport per Unicode, ja que normalment fan servir la llibreria
Xft per gestionar els tipus de lletres. Si el vostre gestor de finestres no fa
servir l'Xft pels tipus de lletra, encara podeu fer servir el FontSpec
mencionat en la secció anterior com a tipus de lletra Unicode.
Els emuladors de terminal que fan servir Xft i tenen suport per Unicode són
més difícils de trobar. Apart del Konsole i el gnome-terminal, les millors
opcions al Portage són x11-terms/rxvt-unicode,
xfce-extra/terminal, gnustep-apps/terminal,
x11-terms/mlterm, o elx11-terms/xterm pelat quan es construeix
amb la opció unicode a la variable USE si s'invoca com a uxterm.
L'app-misc/screen també suporta l'UTF-8, quan s'invoca com a
screen -U o es posa a ~/.screenrc el següent:
Llistat de Codi 3.10: ~/.screenrc per a UTF-8 |
defutf8 on
|
Vim, Emacs, Xemacs i Nano
El Vim proporciona ple suport per UTF-8, i també té incorporada la detecció de
fitxers UTF-8. Per a més informació sobre el Vim, feu servir :help
mbyte.txt.
L'Emacs 22.x i les versions superiors també tenen ple suport de UTF-8.
L'Xemacs 22.x encara no suporta la combinació de caràcters.
Versions anteriors de Emacs i/o Xemacs podrien demanar-li d'instal·lar
app-emacs/mule-ucs i/o app-xemacs/mule-ucs
i afegir el següent codi al vostre ~/.emacs per donar suport a
idiomes CJK amb UTF-8:
Llistat de Codi 3.11: Suport a l'Emacs per a CJK amb UTF-8 |
(require 'un-define)
(require 'jisx0213)
(set-language-environment "Japanese")
(set-default-coding-systems 'utf-8)
(set-terminal-coding-system 'utf-8)
|
El Nano dóna ple suport a UTF-8 des de la versió 1.3.6.
Intèrprets d'ordres
Actualment, el bash dóna ple suport al Unicode a través de la llibreria
GNU readline. Els usuaris de Z Shell estan en una posició pitjor -- no hi ha
cap part de l'intèrpret d'ordres amb suport per a Unicode, tot i que hi ha un
esforç decidit d'afegir suport per a jocs de caràcter de múltiples bytes en
aquests moments.
Els intèrprets d'ordres C shell, tcsh i ksh no tenen cap mena
de suport per a UTF-8.
Irssi
L'Irssi té un ple suport per a UTF-8, tot i que és necessari que l'usuari
configuri la opció.
Llistat de Codi 3.12: Habilitant l'UTF-8 al Irssi |
/set term_charset UTF-8
|
En canals on caràcters no ASCII s'intercanvien sovint amb jocs de caràcters no
UTF-8, es pot fer servir la comanda /recode per convertir els
caràcters. Per a més informació escriviu /help recode.
Mutt
L'agent de correu Mutt té un molt bon suport per a Unicode. Per fer servir
l'UTF-8 en el Mutt, no heu de posar res als vostres fitxers de configuració.
El Mutt funcionarà en un entorn unicode sense modificar-lo si tots els vostres
fitxers de configuració (inclosa la signatura) estan codificats amb UTF-8.
Nota:
Llegint correus amb el Mutt encara podríeu veure '?'. Això passa perquè hi ha
persones que el seu client de correu no indica el joc de caràcters. No hi
podeu fer massa aquí apart de demanar-los que configurin correctament el seu
client.
|
Teniu més informació disponible al Wiki del Mutt.
Less
Tots fem servir moltes vegades more o less amb | per
veure correctament la sortida d'una ordre, com per exemple dmesg |
less. Mentre que pel more només necessitem que l'intèrpret d'ordres
estigui al cas de l'UTF-8, el less necessita que estigui assignada la
variable d'entorn LESSCHARSET, per assegurar-nos que els caràcters
unicode són rendertitzats correctament. Això es pot indicar a
/etc/profile o ~/.bash_profile. Engegueu el vostre
editor preferit i afegiu la següent línia a algun dels fitxers abans mencionats.
Llistat de Codi 3.13: Configurant la variable d'entorn per al less |
LESSCHARSET=utf-8
|
Man
Les pàgines Man són una part integral de qualsevol màquina Linux. Per
assegurar-nos de que qualsevol unicode en les pàgines man es renderitza
correctament, editeu /etc/man.conf i reemplaceu una línia tal com
es mostra aquí sota.
Llistat de Codi 3.14: Canvis al man.conf per donar suport a UTF-8 |
NROFF /usr/bin/nroff -Tascii -c -mandoc
NROFF /usr/bin/nroff -mandoc -c
|
elinks i links
Són dos navegadors en mode text comuns, i hauríem de veure com se'ls pot
habilitar el suport per UTF-8. A l'elinks i links, hi ha dues
maneres de fer-ho, una és utilitzant la opció de configuració del propi
navegador o editant el fitxer de configuració. Per fer-ho des del navegador,
obriu un lloc web amb l'elinks o el links i llavors premeu
Alt+S per entrar al menú de configuració, tot seguit seleccioneu les
opcions del terminal, o premeu T. Baixeu i seleccioneu l'última opció,
UTF-8 I/O, prement Retorn. Seguidament salveu i sortiu del menú. En el
links hauríeu de fer dues vegades Alt+S per tot seguit prémer
S per desar. La opció del fitxer de configuració es mostra aquí sota.
Llistat de Codi 3.15: Habilitant l'UTF-8 pel elinks/links |
set terminal.linux.utf_8_io = 1
terminal "xterm" 0 1 0 us-ascii utf-8
|
Provant-ho tot
Hi ha molts llocs webs amb tests de UTF-8. net-www/w3m,
net-www/links, net-www/elinks, net-www/lynx i tots els
navegadors basats en Mozilla (inclòs el Firefox) suporten UTF-8. També tenen
ple suport per a UTF-8 el Konqueror i l'Opera.
Quan utilitzeu un navegador web en mode text, assegureu-vos del tot que feu
servir un terminal amb Unicode.
Si veieu alguns caràcters que es mostren com a caixes amb lletres o nombres a
dintre, vol dir que el vostre tipus de lletra no té un símbol pel caràcter que
l'UTF-8 vol. En lloc seu, mostra una caixa amb el codi hexadecimal del símbol
UTF-8.
Mètodes d'entrada
Per incloure caràcters a les X que no estan en el vostre teclat podríeu fer
servir tecles mortes. Funciona prement alhora la vostre tecla Alt de la
dreta (o en alguns països AltGr) i una tecla opcional de la secció no
alfabètica del teclat que quedi a l'esquerre de la tecla Retorn, alliberant-los
i seguidament prémer una tecla. La tecla morta hauria de modificar-ho.
L'entrada pot ser modificada després utilitzant la tecla Shift al mateix
moment que es prem la tecla AltGr i la modificadora.
Per habilitar les tecles mortes a les X, necessiteu una presentació que ho
suporti. La majoria de presentacions europees tenen tecles mortes amb les
variants per defecte. Tot i així, això no és cert per les presentacions
d'Amèrica del Nord. Encara que hi ha un grau de inconsistència entre
presentacions, la solució més fàcil sembla ser la d'utilitzar presentacions de
l'estil "en_US" millor que "us", per exemple. La presentació és configura a
/etc/X11/xorg.conf semblant a:
Llistat de Codi 3.16: retall de /etc/X11/xorg.conf |
Section "InputDevice"
Identifier "Keyboard0"
Driver "kbd"
Option "XkbLayout" "en_US"
EndSection
|
Nota:
Els canvis anteriors només es necessiten aplicar si està utilitzant una
presentació d'Amèrica del Nord, o alguna altre presentació en que les tecles
mortes sembli que no funcionen. Els usuaris europeus ja haurien de tenir
funcionant les tecles mortes.
|
L'efecte d'aquest canvi es notarà quan reinicieu el servidor de les X. Per
aplicar aquest canvi de seguida, utilitzeu l'eina setxkbmap, per
exemple, setxkbmap en_US.
Segurament és més fàcil descriure les tecles mortes amb exemples, Tot i així
els resultats depenen del local, els conceptes es mantindran iguals tot i el
local. Els exemples contenen UTF-8, per tan per veure-ho necessitareu dir-li
al vostre navegador que visualitzi la pàgina amb UTF-8, o tenir algun local ja
configurat amb UTF-8.
Quan premo AltGr i [ al mateix moment, les allibero i seguidament premo a, es
produeix 'ä'. Quan premo AltGr i [ al mateix moment, les allibero i
seguidament premo e, es produeix 'ë'. Quan premo AltGr i ; al mateix moment,
es produeix 'á', i quan premo AltGr i ; al mateix moment, les allibero i
seguidament premo e, es produeix 'é'.
Prement AltGr, Shift i [ a la vegada, alliberant-les, i seguidament prement
a, es produeix la a escandinava 'å'. De la mateixa manera, prement AltGr,
Shift i [ a la vegada, alliberant només la [, i seguidament prement-la
altre cop, es produeix '˚'. Tanmateix sembla que un, aquest (U+02DA) no és el
mateix que el símbol de grau (U+00B0). També funciona per altres accents
produïts per tecles mortes — AltGr i [, alliberant només [, seguidament
tornant-la a prémer fa '¨'.
La tecla AltGr també es pot fer servir amb tecles alfabètiques. Per
exemple, AltGr i m fan la lletra grega mu amb minúscula: 'µ'. AltGr i s fan la
lletra essa-zeta o scharfes: 'ß'. I com molt usuaris europeus esperen (perquè
està indicat en el seu teclat), AltGr i 4 (o la E depenent de la disposició
del teclat) produeixen el símbol de l'Euro, '€'.
Recursos
Els continguts d'aquest document estan llicenciats sota la llicènciaCreative Commons -
Reconeixement-CompartirIgual.
|