[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: org/sitemap 文字化け



かねこです。
At 4:10 PM +0900 01.7.11, Tomohiro KUBOTA wrote:
:> iso-2022-jp の方がましのような気もするし。
:
:iso-2022-jp ではなくて、iso-2022 (あるいは iso-2022-jp-2) のつもり
:ですよね? ただ、ブラウザの側でそれらを認識してくれるかどうか。。。

iso-2022-jp の外枠は iso-2022 なので、で iso-2022-jp を指
定して iso8859-1 を呼んでみましたが Netscape 4 と IE5.5 は
ダメでした。この二つがダメだと実用にならんかな。

:> >ISO-8859-1 文字を使いたくなる場面というのは、たぶん原文で
:> >人名に使われている場合だと思いますが、われわれだって英文では
:> >名前を ASCII 文字に置き換えて表現しているのですから、
:> 
:> これは乱暴だと思う。日本だって、異体字ですらがたがた言う人がいると
:> いうのに、u と ü って「違う」字ですからね。断る必要がありそ
:> うです。仮にテレタイプ流の置き換えをやるとしても、ちょっと難しそう
:> な、例えば þ や š なんて普通の人が捌きようもない。
:
:自分自身でも、建設的な意見ではないことは分かってます。ただ、
:異字体が、というのとは話のレベルが違って、われわれは自分の
:名前を、漢字をアルファベットで書き直しているわけです。日本語人が、
:UTF-8 とか ISO-2022 とかの国際化がきちっと考えられていないような
:場所で文書を書くときに、自分の名前を漢字で書いてしまうようなことなど、
:ついうっかりとか、わざと相手を困らせたくて、とか以外には
:考えられないですよね。わたし的には、ヨーロッパ語人にだけそういう
:わがままが認められる、という状況は、いやなんです。

建前はどうでもいいんです。あくまで実務の問題。こと *.wml は
英文(iso-8859-1 の)の元があって、その中で内容が書かれてい
るわけですから、それを日本語に直すときに EUC-JP の中だけで
やろうとするとすでに困るというだけ。漢字の名前をローマ字に
直すような作業を、元が日本語の文書があったとして、ボランテ
ィアの翻訳者に要求しないでしょう。それと同じことだと思う。

#名前だけでなく、フランス語の慣用句はよく見るような気がする

:それはさておき、ISO-2022-JP には ISO-8859-x な文字は存在できない
:ですので、無理になんとかしようとすれば、実体参照を書くよりも
:もっと手のこんだことになりませんか?

手が込むも何も、規格範囲内では実体参照以外では*出来ない*
でしょう。iso-8859-1 はなんとかかんとか実体参照で逃げられる
し、最近は訳をかける前にiso-8859-1 内の文字はツールで実体参
照に直してからやってますけど…。

#実体参照関係は個人用のツールだったりするんですが、広く出
#回っているまっとうなツールってあるんだろうか?

-- 
Seiji Kaneko                         skaneko@xxxxxxxxxxxx
---------------------------------------------------------