[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[debian-users:46410] Re: Manpage encoding: UTF-8 or EUC-JP?



小林です。

お返事ありがとうございます。

> > ありがとうございます。FHS は全く読んだことがありませんでしたでいませんでした。
> > なるほど。
> > 日本のような国では /usr/share/man/ja でなく /usr/share/man/ja_JP.EUC-JP に
> > 置いたほうが本当はよいのですね。
> > それに、時代の流れからすると、「エンコーディング指定なしの場合は UTF-8」
> > という方向に進んでもおかしくないですよね。
> > # これもぼくの勝手な「時代の流れ」かもしれませんが。:-)
> 
> Debian においては, manpage は,/usr/share/man/jaにおく,というようにしているようです.
> ここの部分が明文化されているところはちょっとみつけられていません.

他言語の manpage についても、ピリオド以下で文字コードを指定したディレクトリが
作られているところは特にないように見えますね。
ということは、現状では、

* man-db の src/encodings.c で指定されている、それぞれの言語に
  特有のエンコーディングを使うことが暗黙に指定されていることになり、
  UTF-8 の manpage を /usr/share/man 以下に置けない。
* たとえ新たに /usr/share/man/ja_JP.UTF-8 などを作って UTF-8 の manpage を
  置いたとしても、src/encodings.c の実装ゆえにロケールが ja_JP.UTF-8 のときに
  しか検索されない。
  (明文化されていないとなると、もしかしたら /usr/share/man 以下の manpage に
  UTF-8 のものが混ざっている可能性もある?)

というのがまとめになるでしょうか。

> あと,あらゆるものをUTF-8にするというのは必ずしも賛成しません.
> 既存のファイルのリコードが必要になり,アップグレードが難しくなるからです.

そうですね。よく考えたら HTML やプレインテキストなどのドキュメントは大量に
あるので、それらのリコードは大きな負担になりそうです (元々それらだって
エンコーディングが統一されているわけではありませんし)。

ただ、manpage については、今のままだとエンコーディングが言語ごとに暗黙に
決め打ちとなっている気がするので、もう少し柔軟に対応できるようにしたほうが
よいのでは、と思った次第です。
もちろん現在のままでも言語ごとの標準に従ってきちんと動作するので問題はない
わけですが……。
余裕があったら適当にいじって試してみようと思います。

-- 
|:  Noritada KOBAYASHI
|:  Dept. of General Systems Studies,
|:  Graduate School of Arts and Sciences, Univ. of Tokyo
|:  E-mail: nori1@xxxxxxxxxxxxxxxxxxxxxxx (preferable)
|:          nori@xxxxxxxxxxxxxxxxxxx
|:  Key fingerprint = AB26 9533 81DA 997B 3C06  4380 19BB ADA0 695C 9F53