[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[debian-users:47635] Re: Subject が化ける



長南です。

喜瀬さんのメールより [debian-users:47628]

> > 今回の場合は、判別できなかったのはどこだったのでしょう。

> 以下、EUC-JPな環境で動かしています。試行錯誤したところ、こんな
> 結果になりました。
> 
> $ perl -e 'use Jcode;use Data::Dumper;print Dumper(Jcode::getcode("解決"))'
> $VAR1 = 'euc';
> $VAR2 = 4;
> $ perl -e 'use Jcode;use Data::Dumper;print Dumper(Jcode::getcode("解決]"))'
> $VAR1 = undef;
> $VAR2 = 4;
> $ perl -le 'use Jcode;print $Jcode::VERSION'
> 2.06
> 
> $ echo -n '解決]'|od -tx1
> 0000000 b2 f2 b7 e8 5d
> 0000005
> 
> 漢字コードを判別できない場合、Jcode::getcode()はundefを返します。
> 「解決」だけならEUC-JPで決まりだったのに、“]”が続いたことで
> ほかの文字コードである可能性が出てきた、ということでしょうか。

b7 e8     ---  EUC-JP の「決」
   e8 5d ---  SJIS の「鐓」(タイ、トンと読む。槍や矛のいしづき)

ということみたいですね。もう一字 Subject に漢字か仮名があれば、
正しく判定する可能性がずっと高くなったのでしょうけれど。

-- 
長南洋一