[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
[debian-users:47635] Re: Subject が化ける
長南です。
喜瀬さんのメールより [debian-users:47628]
> > 今回の場合は、判別できなかったのはどこだったのでしょう。
> 以下、EUC-JPな環境で動かしています。試行錯誤したところ、こんな
> 結果になりました。
>
> $ perl -e 'use Jcode;use Data::Dumper;print Dumper(Jcode::getcode("解決"))'
> $VAR1 = 'euc';
> $VAR2 = 4;
> $ perl -e 'use Jcode;use Data::Dumper;print Dumper(Jcode::getcode("解決]"))'
> $VAR1 = undef;
> $VAR2 = 4;
> $ perl -le 'use Jcode;print $Jcode::VERSION'
> 2.06
>
> $ echo -n '解決]'|od -tx1
> 0000000 b2 f2 b7 e8 5d
> 0000005
>
> 漢字コードを判別できない場合、Jcode::getcode()はundefを返します。
> 「解決」だけならEUC-JPで決まりだったのに、“]”が続いたことで
> ほかの文字コードである可能性が出てきた、ということでしょうか。
b7 e8 --- EUC-JP の「決」
e8 5d --- SJIS の「鐓」(タイ、トンと読む。槍や矛のいしづき)
ということみたいですね。もう一字 Subject に漢字か仮名があれば、
正しく判定する可能性がずっと高くなったのでしょうけれど。
--
長南洋一