[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[debian-users:33600] Re: woody で LANG=ja_JP.utf8 は?



At Wed, 10 Jul 2002 00:32:55 +0900,
Tomohiro KUBOTA <tkubota@xxxxxxxxxxx> wrote:
> > 現在、woody で、
> > LANG=ja_JP.utf8
> > を設定して、実際に使っている方がいらっしゃいませんでしょうか。
> > 実際に、使った上での注意点等がありましたら、教えてください。
> 
> 現在の日本語対応ソフトウェアまたは「国際化」ソフトウェアは、
> EUC-JP (と EUC-KR, GB2312, Big5) だけしか考慮していないものが
> 多数あります。それらは全て正常に動きません。たとえば、

はい、その通りですね。

>  - rxvt-beta、rxvt-ml、eterm、gnome-terminal、kon2、jfbterm などは
>    すべて、UTF-8 には対応していません。
>  - Linux コンソールは UTF-8 に対応しているという触れ込みですが、
>    実際には数百文字しか使えないため、日本語を使うことができません。

補足しておきますと、これは i386 PC グラフィックの制限のためで、
512 文字までしか表示することができないことに起因しています。
いちおう console-tools では utf-8 モードが動作して iso-8859-* 系の
文字ならなんとかなるかな…程度には動きましたが、それ以上は
(当然ですが) 無理でした。

日本語を出すための解決策としては frame buffer を利用する
しかなさそうです。

>  - UTF-8 に対応したターミナルエミュレータは、xterm と mlterm くらい
>    しかありません。
>  - UTF-8 に対応したテキストエディタは、emacs + mule-ucs と vim と
>    yudit くらいしかありません。
>  - X Window System のフォントシステムは UTF-8 と相性が悪いため、
>    X 上の多数のソフトウェアで、とても汚い表示になったり、とても
>    重かったりします。
>  - コンソールやターミナルエミュレータ上でレイアウトを考慮する
>    ソフトウェア群の多くが、うまく動きません。たとえば bash では、
>    UTF-8 文字の編集をすると画面の表示内容と内部で持っている内容とが
>    食い違ってしまうことがあります。
>  - 言語ごとに文字コードが一意に決まると暗黙のうちに仮定してしまって
>    いるソフトウェアがあります。たとえば man とか debconf とか。
>    これらは、日本語の場合は EUC-JP でしか使えません。

この問題の一つとして "ja" という名称が現在 EUC-JP の alias に
なっていることが原因ですね。まだこの方針を崩す必要はないと
思っていますが、"ja" という名前が EUC-JP にそのまま alias 
されることを今後は仮定しないようにもっていかなければなりませんね。

> これらの問題の解決について貢献したいと思ってらっしゃる方でないと、
> つらいかもしれません。一方、すでにできることは、
> 
>  - gettext を用いた翻訳メッセージについては、エンコーディングが自動
>    変換されますので、UTF-8 環境でも正しく表示されます。
>  - kinput2 や skkinput を用いた日本語入力についても、ロケールに
>    関係なく正しく動作します。
>  - UTF-8 に対応したテキストビューアである lv があります。

lv では自前のテーブルで unicode を扱えるので、他の
OS でも端末さえ文字が表示できれば utf-8 を読めます (と宣伝 :-)

あと、追加するなら

- mozilla などのブラウザでは、UTF-8 を表示することが可能です。

でしょうか。

-- gotom