[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: org/sitemap 文字化け



くぼたです。

At Wed, 11 Jul 2001 23:08:18 +0900,
Seiji Kaneko <skaneko@xxxxxxxxxxxx> wrote:

> 建前はどうでもいいんです。あくまで実務の問題。こと *.wml は
> 英文(iso-8859-1 の)の元があって、その中で内容が書かれてい
> るわけですから、それを日本語に直すときに EUC-JP の中だけで
> やろうとするとすでに困るというだけ。漢字の名前をローマ字に
> 直すような作業を、元が日本語の文書があったとして、ボランテ
> ィアの翻訳者に要求しないでしょう。それと同じことだと思う。
> 
> #名前だけでなく、フランス語の慣用句はよく見るような気がする

# ほとんど翻訳作業をやってない私より、かねこさんのほうが実務は
# だいぶ分かってらっしゃるのでしょうが。。。

ボランティアだから要求できないのでしょうか?それは違うと思います。
和文英訳の仕事があったとして (たとえば www.debian.or.jp の英訳)、
日本語の名前をローマ字に直すのは、ごくふつうのことでしょう。
もちろん、和文英訳でも日本語の固有名詞はそのままにしておく、
という翻訳のやりかたもあり、それのほうが望ましい場合にはそう
するべきですが、今の話はそういうことではないですよね。

問題の根源は、まだ UTF-8 がそれほど普及していないにもかかわらず、
ISO-8859-1 文字を (英語ウェブページに) 使ってしまっているという
ことにあると思います。英語ウェブページに ISO-8859-1 文字を使う
ということは、英語ウェブページに漢字やアラビア文字を使うのと
同じレベルのことだと思っています。そして、英語ウェブページを
書いている人々に向かって ISO-8859-1 文字を使うなと苦情を言うべき
ことだと思うのですが、たぶん、www@org などで議題にしてみても、
UTF-8 を使うべき、なんていう結論になってしまって、いま現在
UTF-8 がそれほど普及していない時点における問題であるという
ことがなかなか分かってもらえないと思います。で、そこまでして、
英語ページの著者や読者に不便を強いてまで「正しさ」を求めるか、
それとも原文にある ISO-8859-1 文字は和訳では適当にあしらって
化けるに任せてしまうか、あるいは適当な ASCII 文字に置き換えたり
実体参照を使ったりといった手間を受け入れるか、という選択になると
思うのですが。

原文の ISO-8859-1 文字は実体参照を使ってくれ、というくらいなら、
要求できるレベルかもしれませんね。

# もとの話は、UTF-8 に移行できるようになるまで放置でいいのでは、
# という結論でいいですよね? どうせ EUC-JP でも ISO-2022-JP 
# でも、ISO-8859-1 文字を扱えないという点では同じですし。

---
久保田智広 Tomohiro KUBOTA <kubota@debian.org>
http://www.debian.or.jp/~kubota/
"Introduction to I18N"  http://www.debian.org/doc/manuals/intro-i18n/