153 lines
4.6 KiB
HTML
153 lines
4.6 KiB
HTML
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2 Final//EN">
|
|
<HTML>
|
|
<HEAD>
|
|
<META NAME="GENERATOR" CONTENT="SGML-Tools 1.0.9">
|
|
<TITLE>Linux-Esperanto-HOWTO: Kodoj</TITLE>
|
|
<LINK HREF="Esperanto-HOWTO-3.html" REL=next>
|
|
<LINK HREF="Esperanto-HOWTO-1.html" REL=previous>
|
|
<LINK HREF="Esperanto-HOWTO.html#toc2" REL=contents>
|
|
</HEAD>
|
|
<BODY>
|
|
<A HREF="Esperanto-HOWTO-3.html">Next</A>
|
|
<A HREF="Esperanto-HOWTO-1.html">Previous</A>
|
|
<A HREF="Esperanto-HOWTO.html#toc2">Contents</A>
|
|
<HR>
|
|
<H2><A NAME="s2">2. Kodoj</A></H2>
|
|
|
|
<P>Ekzistas tri internaciaj normoj por signokodoj, kiuj enhavas la
|
|
esperantajn signojn, la du kutime uzataj estas
|
|
ISO-8859-3 (Latin-3) kaj Unikodo (Unicode).
|
|
La unua normo estas por okbitaj signoj kaj la dua por
|
|
deksesbitaj. Por povi transporti unikodajxojn tra okbitaj
|
|
kaj sepbitaj medioj ekzistas la kodoj UTF-8 kaj UTF-7.
|
|
<P>
|
|
Cxar Unikodo samtempe difinas koderojn por
|
|
la signoj de cxiuj lingvoj de la mondo, gxi ricevas pli kaj
|
|
pli da subteno de programarproduktantoj.
|
|
<P>Alie ol ekz. Vindozo NT, Linukso interne uzas okbitajn
|
|
kodojn. Subteno de Unikodo precipe estas en sistemkomponentoj,
|
|
kiuj zorgas pri eligado de tekstoj sur la ekrano aux kiuj
|
|
rilatas al intersxangxo de informoj kun la ekstera mondo.
|
|
Do estas iom da Unikodo en la konzolo, iom da en X-fenestroj,
|
|
iom da en la traktado de informoj venantaj per retposxto aux el
|
|
TTT kaj iom da rilate al dosiersistemoj de KKDoj
|
|
(Joliet-dosiersistemo). Ofte tiuj komponentoj uzas la okbitan
|
|
unikodformon UTF-8.
|
|
<P>Cxar la subteno de Unikodo en Linukso estas iom malkohera,
|
|
gxenerale oni preferas ISO-8859-3. Sed supozeble la premisoj
|
|
sxangxigxos gxis la fino de 1999.
|
|
<P>Ampleksajn informojn pri la unuopaj kodoj kun E-signoj
|
|
en internaciaj normoj kaj en specialaj programoj, vi
|
|
trovas cxe
|
|
<A HREF="http://www.rano.demon.co.uk/esperanto-kodoj.html">Edmundo</A>.
|
|
<P>Foje vi bezonas la eblecon konverti esperantajn tekstojn
|
|
de UTF-8 al Latin-3. Por tio vi povas uzi la sekvan
|
|
Perl-programeton.
|
|
<BLOCKQUOTE><CODE>
|
|
<PRE>
|
|
#!/usr/bin/perl
|
|
while (<>) {
|
|
s/\304\210/\306/g;
|
|
s/\304\211/\346/g;
|
|
s/\304\234/\330/g;
|
|
s/\304\235/\370/g;
|
|
s/\304\244/\246/g;
|
|
s/\304\245/\266/g;
|
|
s/\304\264/\254/g;
|
|
s/\304\265/\274/g;
|
|
s/\305\234/\336/g;
|
|
s/\305\235/\376/g;
|
|
s/\305\254/\335/g;
|
|
s/\305\255/\375/g;
|
|
print;
|
|
};
|
|
</PRE>
|
|
</CODE></BLOCKQUOTE>
|
|
|
|
Por konverti en la alia direkto, intersxangxu la du
|
|
kolumnojn inter /../../.
|
|
<P>Por presi Latin-3ajn tekstojn vi povas uzi
|
|
<A HREF="http://www.geocities.com/ResearchTriangle/Node/7900/texprL3.html">solvon de Albert Reiner</A>.
|
|
Temas pri simpla programeto en Perl uzanta TeX-on por la presado.
|
|
<P>Pro kompleteco tie cxi ni donas ankoraux la koderojn
|
|
de la E-signoj laux la plej vastigxintaj normoj. UTF-8,
|
|
kiu kodas unikodajn signojn per okbitaj koderoj,
|
|
estas ekzemple uzata en HTML-pagxoj.
|
|
<P>
|
|
<H2><A NAME="ss2.1">2.1 koderoj deksesume</A>
|
|
</H2>
|
|
|
|
<P>
|
|
<BLOCKQUOTE><CODE>
|
|
<PRE>
|
|
litero Latin-3 Unikodo UTF-8
|
|
-----------------------------
|
|
Cx C6 0108 C4 88
|
|
cx E6 0109 C4 89
|
|
Gx D8 011C C4 9C
|
|
gx F8 011D C4 9D
|
|
Hx A6 0124 C4 A4
|
|
hx B6 0125 C4 A5
|
|
Jx AC 0134 C4 B4
|
|
jx BC 0135 C4 B5
|
|
Sx DE 015C C5 9C
|
|
sx FE 015D C5 9D
|
|
Ux DD 016C C5 AC
|
|
ux FD 016D C5 AD
|
|
</PRE>
|
|
</CODE></BLOCKQUOTE>
|
|
<P>
|
|
<H2><A NAME="ss2.2">2.2 koderoj dekume</A>
|
|
</H2>
|
|
|
|
<P>
|
|
<BLOCKQUOTE><CODE>
|
|
<PRE>
|
|
litero Latin-3 Unikodo UTF-8
|
|
-------------------------------
|
|
Cx 198 0264 196 136
|
|
cx 230 0265 196 137
|
|
Gx 216 0284 196 156
|
|
gx 248 0285 196 157
|
|
Hx 166 0292 196 164
|
|
hx 182 0293 196 165
|
|
Jx 172 0308 196 180
|
|
jx 188 0309 196 181
|
|
Sx 222 0348 197 156
|
|
sx 254 0349 197 157
|
|
Ux 221 0364 197 172
|
|
ux 253 0365 197 173
|
|
</PRE>
|
|
</CODE></BLOCKQUOTE>
|
|
<P>
|
|
<H2><A NAME="ss2.3">2.3 koderoj okume</A>
|
|
</H2>
|
|
|
|
<P>
|
|
<BLOCKQUOTE><CODE>
|
|
<PRE>
|
|
litero Latin-3 Unikodo UTF-8
|
|
-------------------------------
|
|
Cx 306 0410 304 210
|
|
cx 346 0411 304 211
|
|
Gx 330 0434 304 234
|
|
gx 370 0435 304 235
|
|
Hx 246 0444 304 244
|
|
hx 266 0445 304 245
|
|
Jx 254 0464 304 264
|
|
jx 274 0465 304 265
|
|
Sx 336 0534 305 234
|
|
sx 376 0535 305 235
|
|
Ux 335 0554 305 254
|
|
ux 375 0555 305 255
|
|
</PRE>
|
|
</CODE></BLOCKQUOTE>
|
|
<P>
|
|
<P>
|
|
<HR>
|
|
<A HREF="Esperanto-HOWTO-3.html">Next</A>
|
|
<A HREF="Esperanto-HOWTO-1.html">Previous</A>
|
|
<A HREF="Esperanto-HOWTO.html#toc2">Contents</A>
|
|
</BODY>
|
|
</HTML>
|