[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[debian-devel:13818] Re: iconv()



田尻です。
At Tue, 27 Feb 2001 12:15:39 +0900,
Tomohiro KUBOTA wrote:
> 
> くぼたです。
> 
> At Tue, 27 Feb 2001 11:34:16 +0900,
> Takashi Okamoto <toraneko@xxxxxxxxx> wrote:
> 
<省略>
> 
> > あと、Shift_JIS から unicode への変換では、
> > 
> >    TILDA ('~', U+007E) -> OVERLINE (U+203E).
> >    BACKSLASH ('\', U+005C)  -> YEN (U+00A5).
> > 
> > となったりするので、注意が必要ですね。
> 
> これは、Shift_JIS の定義をそのまま実装すると、こういうふうになるのが
> 自然です。というのは、Shift_JIS の 0x21-0x7e は JIS X 0201 Roman 
> だからです。(EUC-JP の 0x21-0x7e は ASCII です)。
> 
> まあ理屈の上ではそれが自然であっても、実用上は変なので、
> どうすればいいんでしょうねえ。
> 

glibc 2.2.2(Debian package だと>=2.2.1-2)だとSJISのかわ
りにIBM932をつかうと
0x7E -> U+007E
0x5C -> U+005C
に変換されます。(CP932,MSKANJIではだめ)

ただ、IBM932とはいってもIBM拡張文字つかうとエラーになります。

MS KanjiコードをIBM拡張文字とかまで含めてあつかうんであ
れば、iconvにあまり期待できないから、sambaとかpostgress
では自前で変換表をもってしまう。
==
Tajiri Yasuhiro