[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[debian-devel:12799] Re: sensible-xtermemu_0.04



> グリフと文字とはどう違うのか、説明していただけないでしょうか。

グリフとは文字の形のこと。極端な例を二つ。

1. いろはの最初の文字。「い」はそのひらがなグリフ。
   「イ」はそのカタカナグリフ。点字グリフというのもあるし、
   モールス信号もグリフかもしれないし、手旗もグリフかも。
   もちろんひらがなとカタカナは違う文字とする立場もあり。
2. 合字。合成される前のものは文字であってグリフではない
   (特に形が合成後にのみ決まる場合)。
   合成された後のものはグリフであるし、それを文字とする
   立場としない立場とがありえる。

他の例で言えば、画面に表示されていないテキストファイルに
文字は含まれるが、グリフは含まれない。

ちなみに書体の違いもグリフという場合と、glyph image として
区別する立場とがある。


> で、ISO 8859-1 とか JIS X 0208 とか ISO 10646 とかは、
> 文字の規格なのか、それともグリフの規格なのか、どっちですか?

どれも文字という事になっていますが、
JIS X 0208 は unification が半端で字体で区別された文字が
別のコードポイントを持っている場合もありますし、
ISO 10646 の BMP は文字集合由来のコードポイントと
グリフ集合由来のコードポイントが混同されていて
わけがわからなくなっています。

> そういうことを分けて考えなければならない理由って、なんですか?

単純に、グリフと文字が違うものだから。
Unicode の様に source separation を適用すると、
個々のコードポイント集合の encoded entity について
グリフと文字を区別しながら検証する必要があるから。

> そして、従来の xterm や kterm では、文字とグリフとはどのように
> 考えられているのでしょうか?

kterm や xterm がどうかは知りませんが、XLFD のドキュメントでは
文字とグリフがほとんど区別されていないかの様に読めます。
論理的には XLFD でいう文字はグリフのことだと考えないと
おかしなことになりますが、プログラマは区別しないかもしれません。
 
> Ytow さんの考える xterm + UTF-8 では、
> 文字とグリフについてはどのように考えるのですか?

xterm の author と フォントの author に聞いて下さい。
しかし、UTF-8 なんだから Unicode と同じ様に
区別して考えているととらえるべきでしょう。

xterm と UTF-8 というよりは X のフォントの方が問題でしょう。
XLFD の character を Unicode な意味での character ととらえる立場と
glyph index だととらえる立場とがあります。
私は前者は無意味だと思いますが、それに固執する人が元気にフォントを
作っていますね。