[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[debian-devel:13321] Re: xearth



> 私が言いたかったことは、言語処理は、その言語を母語とする人が見て
> 「これはおかしいぞ」と感じるようなものであってはいけない、という
> ことです。非 native speaker な人がいくら「これで正しいんだ」と
> 言ったところで、native speaker が「それはおかしい」と感じるなら、
> それは「おかしい」とみなすべきです。

前半は正しいのですが、しかし、後半は危険です。
「おかしい」と「みなす」だけではなく、なぜおかしいのかを明らかにして、
「正しい」と主張する non native を説得する必要があります。
そうしないと、言語処理は必要以上のつぎはぎになってしまいます。
そのためには、「おかしい」と思う native が、なぜそれをおかしいと
おもうのか、そこをより深く理解する必要があるのです。


> # 一般人の感覚はアヤフヤで信頼できないからだめだ、なんて言わない
> # で下さい。そこ以外に言語のよりどころは存在しえないんですから。
> # 言語に関する学問や規格でさえ、もとをたどればそこに行き着くはず。

そのあやふやな感覚を明確にするのが、一般人で「ない」人の
すべきことだと思います。Debian に代表される活動は、
一般人がそれ以上の活躍をする場を提供するものと思います。


> ただ、どこまでが「グリフ」の
> 差でどこまでが「文字」の差か、というのは人によって意見が分かれる
> ところでしょう。

すると、Unicode なモデルを否定するか、または、disambiguator の様な
付加情報をつくり出す必要があります。


> 私が言いたかったのは、A というインクのシミで書くべき
> ところを A' というインクのシミで書くのは間違っている、と多くの人
> (大多数が一般人) が感じるとき、A と A' を統合 (包摂) してしまうのは
> 不適切だ、ということです。

それは正しいのですが、しかし、そこで「多くの人」というのが使用言語
によって分類されてしまうという点があります。ISO-2022 的にはそれで
良いのですが、漢数字の「いち」は CJKV によらず「いち」である、
というのもまた真であると思います。


> 現に Unicode がそこまでの「統合」をしてしまったから、XFree86 としては
> iso10646-1 フォントの日本語版、韓国語版などを作る必要が生じてしまった
> わけです。

繰り返しになりますが、それは誤解だと思います。
Unicode が統合したからではなくて、XLFD に代表されるテクノロジが
文字とグリフを同一視していたからです。


> もし、そこまでの「統合」をしていなかったといたら、つまり、
> Unicode における漢字の統合が一般人が「おかしい」と思わない程度のものに
> 限定されていたとすれば

どこが「おかしい」か、もっと具体的に示しませんか?
そうしないと Markus 君は説得できないし、Markus 君を説得できないと
XLFD の日本 variant エントリは -jp- ではなく -ja- のままでしょう。


> XFree86 は iso10646-1 フォントの日本語版、韓国語版を別個に用意する
> 必要がなかったはずです。

それは ISO-2022 的幻想というか、「文字 == グリフ」モデルに基づく
考えでしょう。X の、低レベルの実装としてはグリフを扱うのは当然ですが、
クライアントの実装ではむしろ文字を扱うべきと思います。



> やってくれたらうれしいな、とも思います。Ytow さんの考えに
> 最終的に同意するかどうかは分かりませんが、Ytow さんがどういう
> ことを考えているのか、興味はあります。

linux-tech あたりには書いていますが、一般向けに書く必要があるかどうか....


> 実際、あまり知られていない
> 考えですので、ほっといてもだれかがやってくれるということは
> あまりなさそうだし、

そうですね。ただ、それはもしかしたらそんな事は必要ない事なのかも
しれない、とも思っています。