[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
[debian-devel:12799] Re: sensible-xtermemu_0.04
> グリフと文字とはどう違うのか、説明していただけないでしょうか。
グリフとは文字の形のこと。極端な例を二つ。
1. いろはの最初の文字。「い」はそのひらがなグリフ。
「イ」はそのカタカナグリフ。点字グリフというのもあるし、
モールス信号もグリフかもしれないし、手旗もグリフかも。
もちろんひらがなとカタカナは違う文字とする立場もあり。
2. 合字。合成される前のものは文字であってグリフではない
(特に形が合成後にのみ決まる場合)。
合成された後のものはグリフであるし、それを文字とする
立場としない立場とがありえる。
他の例で言えば、画面に表示されていないテキストファイルに
文字は含まれるが、グリフは含まれない。
ちなみに書体の違いもグリフという場合と、glyph image として
区別する立場とがある。
> で、ISO 8859-1 とか JIS X 0208 とか ISO 10646 とかは、
> 文字の規格なのか、それともグリフの規格なのか、どっちですか?
どれも文字という事になっていますが、
JIS X 0208 は unification が半端で字体で区別された文字が
別のコードポイントを持っている場合もありますし、
ISO 10646 の BMP は文字集合由来のコードポイントと
グリフ集合由来のコードポイントが混同されていて
わけがわからなくなっています。
> そういうことを分けて考えなければならない理由って、なんですか?
単純に、グリフと文字が違うものだから。
Unicode の様に source separation を適用すると、
個々のコードポイント集合の encoded entity について
グリフと文字を区別しながら検証する必要があるから。
> そして、従来の xterm や kterm では、文字とグリフとはどのように
> 考えられているのでしょうか?
kterm や xterm がどうかは知りませんが、XLFD のドキュメントでは
文字とグリフがほとんど区別されていないかの様に読めます。
論理的には XLFD でいう文字はグリフのことだと考えないと
おかしなことになりますが、プログラマは区別しないかもしれません。
> Ytow さんの考える xterm + UTF-8 では、
> 文字とグリフについてはどのように考えるのですか?
xterm の author と フォントの author に聞いて下さい。
しかし、UTF-8 なんだから Unicode と同じ様に
区別して考えているととらえるべきでしょう。
xterm と UTF-8 というよりは X のフォントの方が問題でしょう。
XLFD の character を Unicode な意味での character ととらえる立場と
glyph index だととらえる立場とがあります。
私は前者は無意味だと思いますが、それに固執する人が元気にフォントを
作っていますね。