[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
[debian-devel:13818] Re: iconv()
田尻です。
At Tue, 27 Feb 2001 12:15:39 +0900,
Tomohiro KUBOTA wrote:
>
> くぼたです。
>
> At Tue, 27 Feb 2001 11:34:16 +0900,
> Takashi Okamoto <toraneko@xxxxxxxxx> wrote:
>
<省略>
>
> > あと、Shift_JIS から unicode への変換では、
> >
> > TILDA ('~', U+007E) -> OVERLINE (U+203E).
> > BACKSLASH ('\', U+005C) -> YEN (U+00A5).
> >
> > となったりするので、注意が必要ですね。
>
> これは、Shift_JIS の定義をそのまま実装すると、こういうふうになるのが
> 自然です。というのは、Shift_JIS の 0x21-0x7e は JIS X 0201 Roman
> だからです。(EUC-JP の 0x21-0x7e は ASCII です)。
>
> まあ理屈の上ではそれが自然であっても、実用上は変なので、
> どうすればいいんでしょうねえ。
>
glibc 2.2.2(Debian package だと>=2.2.1-2)だとSJISのかわ
りにIBM932をつかうと
0x7E -> U+007E
0x5C -> U+005C
に変換されます。(CP932,MSKANJIではだめ)
ただ、IBM932とはいってもIBM拡張文字つかうとエラーになります。
MS KanjiコードをIBM拡張文字とかまで含めてあつかうんであ
れば、iconvにあまり期待できないから、sambaとかpostgress
では自前で変換表をもってしまう。
==
Tajiri Yasuhiro