[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[debian-users:03331] Re: ja_JP locale



  吉山です。

I received from Kaz.Sasayama@xxxxxxxxxxxxxxx on 12 07 , 1997. 

+ AY>   をを,素晴らしい.キャラクタ ID の命名ルールはこれでいいのかどうかは
+ AY> 分かりませんが,こういうのが欲しかったんです(どこにあったんですか?).
+ glibc 1.9xのころに入っていたと思ったんですが、Linux-GCCの開
+ 発用メーリングリストに入っていたころに拾ったもののようです。
+ しかし正しいのかどうかは分かりません。対応するcharmapファイ
+ ルもないし、localdefにも通らない。

  以前のプロジェクトでも同様の報告がありました。
  何故 localedef に通らないのでしょうか?

# 基本的に signed char だからでしょうか。

+ AY>   良い参考文献などありましたら,御教示願います.
+ The Open GroupのUnix仕様が以下の場所にありました。元になる規
+ 格はPOSIX.2だと思うんですが、まだそれは見付けていません。
+ http://www.rdg.opengroup.org/onlinepubs/7908799/xbd/charset.html
+ http://www.rdg.opengroup.org/onlinepubs/7908799/xbd/locale.html
+ これによると多バイト文字とワイド文字の変換は、処理系依存のよ
+ うです。多バイト文字EUCでワイド文字ISO 10646とかだと、これだ
+ けでは対応できませんね。ロッキングシフトもダメみたいです。

  ロッキングシフトってのは、JIS のシフト状態がある奴の事ですか?
  用語に弱いもので…。

+ glibcにEUC/JIS対応を追加したとき、ワイド文字をどうしたらいい
+ かっていうのが気になります。

  他の兼ね合いと glibc 本来のポリシーへの敬意によって、以前のパッチで
はワイド文字を UCS4 で実装していました。今実装している変換関数も同様で
す。localedef なんかの絡みもありますし。
  基本的には、

   1) locale ディレクトリ下に各コード系用の変換テーブルがあれば
      それを使用。
   2) なければ、本来の UTF->UCS 変換関数を実行

というポリシーで実装しています。

+ 4.4BSDではこのあたりどうしているんでしょうか?

  EUC の亜種でやっているという話を聞いた事があります。

+ charmapファイルを拡張して、`<encoding_scheme> euc'とか。

  まだまだ勉強の足らない私です。

---

  name   : 吉山あきら (Akira Yoshiyama)
  e-mail : yosshy@debian.or.jp, yosshy@xxxxxxxxxxxxxxxxxxxxx
  URL    : http://jedi.seg.kobe-u.ac.jp/~yosshy/linux.html