[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[debian-devel:10306] Re: Draft 1 (Re: I18N Document)



久保田です。

From: Hiroshi KISE <fuyuneko@xxxxxxxxxxxx>
Subject: [debian-devel:10300] Re: Draft 1 (Re: I18N Document)
Date: Tue, 7 Sep 1999 16:28:34 +0900

> >  * ISO-2022-JP (aka JIS code)
> >     - stateful
> >     - 7bit
> >     - ASCII, JIS X 0201, JIS X 0208, JIS X 0212 can be used.
> >     - used for e-mail and web.
> 
> WWWでは3つのどのコードで書かれたページもあります。WWWのかわりに
> NetNewsを入れたほうがよいかも。

NetNews もそうなのですね。それでは入れておきます。WWW は、
判別を間違うブラウザがあったりするので、ISO-2022-JP が好ましい
という考えが広まっています (というほどでもないかも) ので、
入れておきました。しかし、これだと必ず ISO-2022-JP が使われる
ように受け止められるので、 preferred for Web  くらいに変える
ことにします。


> >  * SHIFT-JIS (aka Microsoft Kanji Code)
> >     - stateless
> >     - 8bit
> >     - ASCII, JIS X 0201, and JIS X 0208 can be expressed.
> >     - The only Japanese code for Windows/Macintosh. This makes
> >       SHIFT-JIS the most popular code in Japan.
> 
> UNIXでもSHIFT-JISを使っている(いた)ものもありますよね。
> X68000などでも使ってたはずだし。ですので、“only”ではないです。

すみません、Win/Mac は SJIS "だけ" をサポートしている、という
意味にしたかったのです。(UNIX では標準がなく、どちらかというと
EUC が好まれている、くらいであるのと対比させたい)。それから、
ここでは UNIX だけを対象にしています。(Win/Mac を登場させたのは、
日本で最も広く使われている、ということを言うために引き合いに出した
だけです)。


> きいた話でよくわからないのですが、EUCには3バイト文字があるらしい
> のですが…えっと、0x8fで始まるやつですね。上の文章には含まれてないので
> いいか。

存在します。でも、日本人でさえ知らないようなコードですからね...
とりあえず、EUC は日本語は 2 バイトだというのは間違った表現
なので変えます。


> プログラムの内部で使われるコードはなんでもよいのですが、外部との
> やりとりをするときには変換しなくちゃいけない…なんてのは範囲外の
> 話かな。

Contents の 5 とかに入る予定です。wchar_t を使いましょう、
という内容にしたいと思っています。そうすると、内部表現に
かんする知識を一切使えないので、厳密な I18N ができます。
でも、カラム数が必要となる場合はどうなるんだろう...
このへんが、難しいところですね。カラム数って、規格には
ないですから。(でも必要)。


/***********************************************************
 * 久保田智広  Tomohiro KUBOTA
 * tkubota@xxxxxxxxxxx
 * 351-0198 埼玉県和光市広沢2-1 理化学研究所 表面化学研究室
 * TEL 048-467-9406  (または 048-462-1111 内線 3564)
 * FAX 048-462-4663  (または 048-462-1111 内線 3560)
 ***********************************************************/