[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[debian-users:41261] Re: lv で複数の日本語テキストファイルを読む時



武藤@Debianぷろじぇくとです。

At Sun, 5 Sep 2004 22:47:55 +0900,
MATSUDA Yoh-ichi / 松田陽一 wrote:
> lv で複数の日本語テキストファイルを読む時、最初のファイルの文字
> コードで他のファイルも判別してしまうようです。
> これは lv の仕様なのでしょうか?
> 
> 日本語 spam を連続して読む際に、 jless ですと UTF-8 が読めないの
> で、 lv を使うのですが、コマンドラインにて複数の spam を指定して
> 連続で読み込ませると、最初に UTF-8 を読むと、次に 7bit JIS やシ
> フト JIS のファイルを読もうとしても、文字化けが起こります。

バグっぽい気がします。

lv 4.50-1で、かなり長めの某テキストを元にEUC(E),JIS(J),SJIS(S),UTF8(U)
にて連続表示の実験をしてみました(変換はnkfを利用、単独で表示できること
は確認済み)。

E→J ○
E→S ×
E→U ×

J→E ○
J→S ○
J→U ○

S→E ×
S→J ○
S→U ×

U→E ×
U→J ×
U→S ×

JISはだいたいOKなのにU→Jは×というのは興味深い。
-- 
武藤 健志@ kmuto @ kmuto.jp
           Debian/JPプロジェクト   (kmuto@debian.org, kmuto@debian.or.jp)
           株式会社トップスタジオ  (kmuto@xxxxxxxxxxxxxxx)
URI: http://www.topstudio.co.jp/~kmuto/ (Debianな話題など)