[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
[debian-users:21892] Re: man-db and JLESSCHARSET
久保田です。
From: GOTO Masanori <gotom@debian.or.jp>
Subject: [debian-users:21890] Re: man-db and JLESSCHARSET
Date: Sat, 15 Apr 2000 00:36:51 +0900
> > > # ちなみに、apt-get install manpages-pl ; LANG=pl_PL man ls
> > > # とかやってみても (ポーランド語 [ISO-8859-2]) でも、-Tlatin1 です。
>
> これは、latin1 以外が対応していないためでしょう。
> しかし latin1 に対応していなくても同じ ISO-8859-* で
> あれば、問題はなさそうな感じがします (font 依存?)。
ISO-8859-2 では、ハイフンは OK ですが、(C) や ・ がダメです。
manpages-* が提供されている言語でいえば、ハンガリー語も ISO-8859-2
のはずです。
latin1 ですが、LESSCHARSET に与える値としては、 8 ビットクリーン
くらいの意味みたいです。このへん、なんだかなあ、と思ってしまいます。
# 8ビットクリーンだったら別の名前にしろよ、って。
ところで、man-db の改造を試みようとしているのですが、
その前提として、Latin1 のテストをやっています。
woody で、xterm 上で、
JLESSCHARSET= LESSCHARSET=latin1 LANG=de man -Lde ls
とかやっても、いちおうドイツ語版を出そうと努力はしている
みたいなんですが、ISO-8859-1 文字が表示されません。
less <man のソース> とかすると、ISO-8859-1 はきちんと表示
されるのですが。LC_* 環境変数は一切設定していません。
jgroff と jless がインストールされているから、という理由が考え
られるので、これから groff と less のインストールを試そうと思って
いるところです。
もし、なにかツボみたいなのをご存知の方がいらっしゃったら、
教えていただけないでしょうか?
> ヨーロッパ系の方には、好き好んで ISO-8859-* の ' を使う
> 方もいらっしゃいますね。1 byte 文字しか使わない人は良いですが、
> multi/wide char には、これほど困ることはありませんよね。
0xb4 のバッククォートですね。これは、ISO-8859-1,2,3,4,8,9 では
使えて、ISO-8859-5,7,10 では使えません。というわけで、困るのは、
CJK、ロシア (ISO-8859-5)、ギリシア (ISO-8859-7)、タイ (TIS620)、
などです。たぶん、ロシアでは ISO-8859-5 よりも KOI8 のほうが一般的
だと思うのですが、その文字コード表が見あたりませんでした。
ちなみに、
http://www.kudpc.kyoto-u.ac.jp/~yasuoka/CJK.html
を見ると、いろんな文字コード表があります。
---
Tomohiro KUBOTA <kubota@debian.or.jp>
http://surfchem0.riken.go.jp/~kubota/