[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: org/sitemap 文字化け



くぼたです。

At Wed, 11 Jul 2001 12:05:10 +0900,
Seiji Kaneko <se-kane@xxxxxxxxxxxxxxxxx> wrote:

> >ISO-2022-JP encoding では、ISO-8859-1 character set は使えませんけど。
> >(ちなみに、ISO-2022-JP-2 なら使えます。が、そういうことで
> >いいのでしょうか?)
> 
> それは承知。でも、今回はスクリプトの関係でコードセットを切り変える
> という話ですが、思うに「だめなものをだめなもので置き換えたってダメ
> じゃん」ですね。変えるなら EUC-JP はスキップして、UTF-8 を待ちた
> いと思うのは乱暴かなぁ。まだ外側の枠では iso-8859-x が使える
> iso-2022-jp の方がましのような気もするし。

なるほど。UTF-8 待ちというのはひとつの手ですね。どうせ手間をかけて
エンコーディングを変換するのなら、それくらいしないと割が合わない
かも。まあそれまでは、スクリプトのたぐいは騙し騙し使う、ということで。


> iso-2022-jp の方がましのような気もするし。

iso-2022-jp ではなくて、iso-2022 (あるいは iso-2022-jp-2) のつもり
ですよね? ただ、ブラウザの側でそれらを認識してくれるかどうか。。。


> >ISO-8859-1 文字を使いたくなる場面というのは、たぶん原文で
> >人名に使われている場合だと思いますが、われわれだって英文では
> >名前を ASCII 文字に置き換えて表現しているのですから、
> 
> これは乱暴だと思う。日本だって、異体字ですらがたがた言う人がいると
> いうのに、u と &uuml; って「違う」字ですからね。断る必要がありそ
> うです。仮にテレタイプ流の置き換えをやるとしても、ちょっと難しそう
> な、例えば &thorn; や &scaron; なんて普通の人が捌きようもない。

自分自身でも、建設的な意見ではないことは分かってます。ただ、
異字体が、というのとは話のレベルが違って、われわれは自分の
名前を、漢字をアルファベットで書き直しているわけです。日本語人が、
UTF-8 とか ISO-2022 とかの国際化がきちっと考えられていないような
場所で文書を書くときに、自分の名前を漢字で書いてしまうようなことなど、
ついうっかりとか、わざと相手を困らせたくて、とか以外には
考えられないですよね。わたし的には、ヨーロッパ語人にだけそういう
わがままが認められる、という状況は、いやなんです。

それはさておき、ISO-2022-JP には ISO-8859-x な文字は存在できない
ですので、無理になんとかしようとすれば、実体参照を書くよりも
もっと手のこんだことになりませんか?

---
久保田智広 Tomohiro KUBOTA <kubota@debian.org>
http://www.debian.or.jp/~kubota/
"Introduction to I18N"  http://www.debian.org/doc/manuals/intro-i18n/