[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[debian-devel:13109] Re: inside of coming groff



> CJK グリフは uni<Unicode>、たとえば 'uni635F' とかになる
> そうです。

調べていませんが、たとえば「辺」の variant の扱いなど
どうなっていますか。

> のぞみさんのおっしゃる Adobe のグリフインデクスとは、
> これのことでしょうか?

そうだとおもいます。CID 由来のものを考えています。
要は、「グリフを符合化した」というのが明確なものであれば
Adobe である必要性はありません。

> # というか、Adobe がこんなことを考えてるのだとすると、
> # ちょっと悲しいものがありますね。

なぜですか? Unicode ベースでグリフが符合化できるかどうかは別として、
表示のためにグリフを符合化しようという発想は極めて正しいと思いますが。

> > > とりあえず固定幅のフォントだけ扱えればいい、ってことにするのかな。
> > リガチャがあるからそうはできない。
> CJK ideographics にはリガチャがないし、

CJK ideogram 限定で議論していたのですね。私はもっと広く考えていました。
最低でもかなを含めて。

> それにプロポーショナルフォントにおいても同じ幅になるものだと思ってま
> したが。

はしご高のグリフがない表示系で「はしご」と「くち高」の組合せではしご高を
表示したことにする、という極端な例はさておき、かなと濁点や半濁点との
合成は文字幅がかわります。

> # 個人的には、ひらがな・かたかなについても等幅のほうが好きで、
> # MS Pゴシックとか MS P明朝とかの、等幅でないひらがな・かたかなを
> # 読んでると気持が悪いです。

でも、「あ゛」なんてのは幅はさておきリガチャしてほしくありません?

> というか、われわれの興味というのが、文字化けしない環境をどうやって
> 作るかというところにあるので、くち高とはしご高の区別なんてのは
> 贅沢な問題として低い優先順位がついているのだと思います。

私は贅沢だとは思いません、むしろいわゆる文字化けのもっとも重篤な例だと
考えています。いわゆる文字化けにはいくつかの種類があって、

1. 文字集合の不整合によるもの   (例: JIS X0208 といわゆる機種依存文字)
2. 文字コードの不整合によるもの (例: EUC と Shift JIS)
3. 字形集合の不整合によるもの   (例: 適当なフォントがない)
4. 字体集合の不整合によるもの   (例: 適当なフォントがない)

というのが考えられます。3, 4 は表示系の問題ですが、1, 2 はそれ以前の、
もっと重要な問題であり、特に 1 は文字集合間の写像をどうするか、より
正確には個々の文字集合を規定している同値律系をどうとらえるか、という
根幹の問題です。今までの、「EUC でいいじゃん」という態度で済んでいた
うちは文字化けといえば表示系の問題か、せいぜい 2. までが主で、1. に
ついては該当する文字が少ないのと、他の文字の合成でほぼ対応できるため
「機種依存文字は使わない様にしましょう」というので済んでいましたが、
Unicode な CJK になる時点で 1. がとても多くなります。「JIS X0208 でな
いもの == 機種依存文字ないし外字」の JIS X0208 に相当する集合が
Unicode の CJK には存在しないどころか、個々の文字の同一性が怪しいもの
もあるので、Unicode ベースへの移行には注意が必要です。なにもかも
Unicode になってしまえばそれはそれで良いのかもしれませんが、
しばらくは移行期間があるでしょうし、その間はたとえば X での
Unicode なクライアントと legacy code なクライアントとの間での
cut and paste くらいはサポートしておいたほうが良いでしょう。
そうなると、文字集合をどうやって整合させるか、というのが
重要なポイントになってきます。
 

> # 私なんか、groff に禁則処理がなくてもまあいいか、とまで考えてますから。
> ## 禁則処理がなくたって、美しくはないけど読めますから。

禁則のいくつかは文の処理単位の問題なので、美しいかどうかとは別の次
元でしょう。拗音に関する禁則がそれにあたります。

> 日本語で (英語でもいいけど) 解説記事を書いてくれたりしたら、
> うれしいんだけどなあ (とか言ってみる:-)。

時間があるかどうかはさておき、網羅的なものを書く自信はありません。
linux-tech あたりをサブスクライブして、「そういう解説文書がないと
困る」と言って分からない用語リストを投げてみると、分担できるので
用語解説くらいは作れるかもしれません。あるいは li18nux の方に
要望を出してみるのも良いかもしれません。

> たいていほとんど理解できなくて、「○○ってなんですか?」と質問
> するとその答えのなかに分からない言葉や概念がいっぱいあって、
> それについて「○○ってなんですか?」と質問するとさらに分からない
> 言葉や概念がネズミ算式に増えていく、というのが正直なところです。

最初のうちはしかたないと思います。
慣れて来れば概念自体はそれほど難しいことではないでしょう。
要は「字体と文字は区別しましょう」「文字が同じとはどういうことですか」
というだけだと思います。

--
のぞみ