[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[debian-users:21892] Re: man-db and JLESSCHARSET



久保田です。

From: GOTO Masanori <gotom@debian.or.jp>
Subject: [debian-users:21890] Re: man-db and JLESSCHARSET
Date: Sat, 15 Apr 2000 00:36:51 +0900

> > > # ちなみに、apt-get install manpages-pl ; LANG=pl_PL man ls
> > > # とかやってみても (ポーランド語 [ISO-8859-2]) でも、-Tlatin1 です。
> 
> これは、latin1 以外が対応していないためでしょう。
> しかし latin1 に対応していなくても同じ ISO-8859-* で
> あれば、問題はなさそうな感じがします (font 依存?)。

ISO-8859-2 では、ハイフンは OK ですが、(C) や ・ がダメです。
manpages-* が提供されている言語でいえば、ハンガリー語も ISO-8859-2 
のはずです。


latin1 ですが、LESSCHARSET に与える値としては、 8 ビットクリーン
くらいの意味みたいです。このへん、なんだかなあ、と思ってしまいます。

# 8ビットクリーンだったら別の名前にしろよ、って。


ところで、man-db の改造を試みようとしているのですが、
その前提として、Latin1 のテストをやっています。
woody で、xterm 上で、
JLESSCHARSET= LESSCHARSET=latin1 LANG=de man -Lde ls
とかやっても、いちおうドイツ語版を出そうと努力はしている
みたいなんですが、ISO-8859-1 文字が表示されません。
less <man のソース> とかすると、ISO-8859-1 はきちんと表示
されるのですが。LC_* 環境変数は一切設定していません。

jgroff と jless がインストールされているから、という理由が考え
られるので、これから groff と less のインストールを試そうと思って
いるところです。

もし、なにかツボみたいなのをご存知の方がいらっしゃったら、
教えていただけないでしょうか?


> ヨーロッパ系の方には、好き好んで ISO-8859-* の ' を使う
> 方もいらっしゃいますね。1 byte 文字しか使わない人は良いですが、
> multi/wide char には、これほど困ることはありませんよね。

0xb4 のバッククォートですね。これは、ISO-8859-1,2,3,4,8,9 では
使えて、ISO-8859-5,7,10 では使えません。というわけで、困るのは、
CJK、ロシア (ISO-8859-5)、ギリシア (ISO-8859-7)、タイ (TIS620)、
などです。たぶん、ロシアでは ISO-8859-5 よりも KOI8 のほうが一般的
だと思うのですが、その文字コード表が見あたりませんでした。

ちなみに、
http://www.kudpc.kyoto-u.ac.jp/~yasuoka/CJK.html
を見ると、いろんな文字コード表があります。

---
Tomohiro KUBOTA <kubota@debian.or.jp>
http://surfchem0.riken.go.jp/~kubota/