[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: org/sitemap 文字化け



かねこです。

At 23:14 01/07/10 +0900, you wrote:
>At Tue, 10 Jul 2001 22:03:53 +0900,
>Seiji Kaneko <skaneko@xxxxxxxxxxxx> wrote:
>
>> 個人的には、やっぱり latin が混在できないので EUC-JP はヤ
>> です。Bug 関係の翻訳でも iso-8859-1 は出てきますし、そこは
>> 私は実体参照で逃げてしまったけど、こんなこと翻訳者にさせて
>> いたら敷居が高くなるだけです :-)
>
>ISO-2022-JP encoding では、ISO-8859-1 character set は使えませんけど。
>(ちなみに、ISO-2022-JP-2 なら使えます。が、そういうことで
>いいのでしょうか?)

それは承知。でも、今回はスクリプトの関係でコードセットを切り変える
という話ですが、思うに「だめなものをだめなもので置き換えたってダメ
じゃん」ですね。変えるなら EUC-JP はスキップして、UTF-8 を待ちた
いと思うのは乱暴かなぁ。まだ外側の枠では iso-8859-x が使える
iso-2022-jp の方がましのような気もするし。

>ISO-8859-1 文字を使いたくなる場面というのは、たぶん原文で
>人名に使われている場合だと思いますが、われわれだって英文では
>名前を ASCII 文字に置き換えて表現しているのですから、

これは乱暴だと思う。日本だって、異体字ですらがたがた言う人がいると
いうのに、u と &uuml; って「違う」字ですからね。断る必要がありそ
うです。仮にテレタイプ流の置き換えをやるとしても、ちょっと難しそう
な、例えば &thorn; や &scaron; なんて普通の人が捌きようもない。

--
Seiji Kaneko                      se-kane@xxxxxxxxxxxxxxxxx
-----------------------------------------------------------