[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[debian-users:33790] Re: samba でファイル名の「〜」が文字化け



かねこです。

At 7:23 PM +0900 02.7.23, TAKAHASHI Motonobu wrote:
:Samba 2.99 は Samba 3.0 ベースだと思いますが、Samba 3.0 では、Samba
:2.2 までと異なり、文字コードの変換を iconv() で行なうような実装になっ
:ています(xxxx charset で指定されたパラメータは、そのまま iconv() の引
:数として渡されます)。なお、Samba 2.2 系列では文字コードの変換ロジック
:は Samba 内部で持っています。
:
:そのため、iconv() 的に Unicode と CP932 の間での変換が1対1ではない
:文字の場合は、こうした問題が発生してしまう可能性があります。

Unicode と CP932 間は問題の箇所は一対一ですから、もしこれが本当に
問題なら、EUC-JP_CP932 なる charset (EUC-JP を CP932 のようにマッ
ピングする)を作れば問題が閉じるような気がするんですけど、気のせ
い?
これをつくるということはまた別問題で難しいのは承知だけど、iconv
の問題では全くないと思う。Microsoft の問題ではあっても。

この件の問題は、CP932 の SJIS encoding の「〜」文字と EUC-JP の
「〜」をがんばって同一視しようとしているから難しいんで、変換表の
言っていることは、この二つの charset はencoding だけでなく、そも
そも charset として違う、だと思うな。で、samba の場合それで困るよ
うな気が全くしない。



-- 
Seiji Kaneko                         skaneko@xxxxxxxxxxxx
---------------------------------------------------------