[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[debian-users:47763] Re: SpamAssassin の文字コード



SpamAssassinは設定したこともありません。以下、すべて間違って
いる可能性があります。

From: peko <peko@xxxxxxxxxxxxxx>
Subject: [debian-users:47760] Re: SpamAssassin の文字コード
Date: Mon, 11 Dec 2006 21:21:41 +0900
> > それは文字コードがマッチしていないからじゃないでしょうか。
> > base64 エンコードされたテキストの文字コードを調べることが先決です。
> 何かよく理解していないまま質問しているようで申し訳ないです。

base64されているかどうかではなくて、base64から戻したデータの
文字コードが何か、という話ではないでしょうか。「無料」ですと、
(Perlでの書き方です)

ISO-2022-JP: \x4C\x35\x4E\x41 (コード切り換え部分を除く)
SJIS       : \x96\xB3\x97\xBF

となります。参考にされたuser_prefsをみたところ、前者は

body MURYOU /L5NA/

のところに定義されているようです。

$ perl -le 'print "\x4C\x35\x4E\x41"'
L5NA
$ perl -le 'print "\x1B\x24\x42" . "L5NA" . "\x1B\x28\x42"'
無料

で、SJISで定義する方法ですが、そのuser_prefsの後ろにコメントされている
SJIS_xxxxを例を参考にしてはいかがでしょう。

たとえば、「まってます」を作るとします。
$ cat mattemasu.txt
まってます
$ nkf -s mattemasu.txt |od -tx1
0000000 82 dc 82 c1 82 c4 82 dc 82 b7 0a
0000013

最後の“0a”は改行なので省いて、こんな感じ?

body SJIS_MATTEMASU_TRY /\x82\xDC\x82\xC1\x82\xC4\x82\xDC\x82\xB7/


> ちょっと、失礼して、実例で説明させていただきます。

base64の部分、1行目だけ調べてみましたが、SJISみたいですね。
-- 
喜瀬“冬猫”浩