[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
[debian-users:41261] Re: lv で複数の日本語テキストファイルを読む時
- From: Kenshi Muto <kmuto@xxxxxxxx>
- Subject: [debian-users:41261] Re: lv で複数の日本語テキストファイルを読む時
- Date: Sun, 5 Sep 2004 23:09:42 +0900
- List-help: <mailto:debian-users-ctl@debian.or.jp?body=help>
- List-id: debian-users.debian.or.jp
- List-owner: <mailto:debian-users-admin@debian.or.jp>
- List-post: <mailto:debian-users@debian.or.jp>
- List-software: fml [fml 4.0.3 release (20011202/4.0.3)]
- List-unsubscribe: <mailto:debian-users-ctl@debian.or.jp?body=unsubscribe>
- X-ml-info: If you have a question, send e-mail with the body "help" (without quotes) to the address debian-users-ctl@debian.or.jp; help=<mailto:debian-users-ctl@debian.or.jp?body=help>
- X-ml-name: debian-users
- X-mlserver: fml [fml 4.0.3 release (20011202/4.0.3)]; post only (only members can post)
- X-original-to: debian-users@debian.or.jp
- X-spam-level: *
- X-spam-status: No, hits=1.4 required=10.0 tests=IN_REP_TO,ISO2022JP_BODY,ISO2022JP_CHARSET, LINES_OF_YELLING,LINES_OF_YELLING_2,LINES_OF_YELLING_3, PLING_QUERY,QUOTED_EMAIL_TEXT,RCVD_IN_ORBS, RCVD_IN_OSIRUSOFT_COM,REFERENCES,SIGNATURE_SHORT_DENSE, SPAM_PHRASE_00_01,USER_AGENT,X_OSIRU_OPEN_RELAY version=2.44
- X-virus-scanned: by amavisd-new-20030616-p7 (Debian) at topstudio.co.jp
- References: <20040905.224754.112601992.yoh@xxxxxxxx>
- Message-id: <20040905140941.B753B222F01@xxxxxxxxxxxxxxxxxxxx>
- X-mail-count: 41261
- User-agent: Wanderlust/2.11.30 (Wonderwall) SEMI/1.14.6 (Maruoka) FLIM/1.14.6 (Marutamachi) APEL/10.6 MULE XEmacs/21.4 (patch 15) (Security Through Obscurity) (i386-debian-linux)
武藤@Debianぷろじぇくとです。
At Sun, 5 Sep 2004 22:47:55 +0900,
MATSUDA Yoh-ichi / 松田陽一 wrote:
> lv で複数の日本語テキストファイルを読む時、最初のファイルの文字
> コードで他のファイルも判別してしまうようです。
> これは lv の仕様なのでしょうか?
>
> 日本語 spam を連続して読む際に、 jless ですと UTF-8 が読めないの
> で、 lv を使うのですが、コマンドラインにて複数の spam を指定して
> 連続で読み込ませると、最初に UTF-8 を読むと、次に 7bit JIS やシ
> フト JIS のファイルを読もうとしても、文字化けが起こります。
バグっぽい気がします。
lv 4.50-1で、かなり長めの某テキストを元にEUC(E),JIS(J),SJIS(S),UTF8(U)
にて連続表示の実験をしてみました(変換はnkfを利用、単独で表示できること
は確認済み)。
E→J ○
E→S ×
E→U ×
J→E ○
J→S ○
J→U ○
S→E ×
S→J ○
S→U ×
U→E ×
U→J ×
U→S ×
JISはだいたいOKなのにU→Jは×というのは興味深い。
--
武藤 健志@ kmuto @ kmuto.jp
Debian/JPプロジェクト (kmuto@debian.org, kmuto@debian.or.jp)
株式会社トップスタジオ (kmuto@xxxxxxxxxxxxxxx)
URI: http://www.topstudio.co.jp/~kmuto/ (Debianな話題など)