[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[debian-users:21680] Re: chasen 2.0



<87zorabmik.wl@xxxxxxxxxxxxxxxxxxx>の記事において
shugo@xxxxxxxxxxxxさんは書きました。

>> ChaSen version 1.51 (c) 1996,1997 Nara Institute of Science and Technology
>>        Grammar files are compatible with JUMAN 2.0
                            ^^^^^^^^^^^^^^^^^^^^^^^^^
>> ChaSen version 2.0 (c) 1996-1999 Nara Institute of Science and Technology
>> Grammar files are in ChaSen's new v-gram format.
                     ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
  ChaSen 2.0 以降、附属される辞書の形式が変わったためだと思います。

>> $ chasen -F "%H(%h):%BB(%b):%y\n"
>> 今日はいい天気です
>> 名詞(16):副詞可能(0):キョウ
>> 助詞(63):係助詞(0):ハ
>> 形容詞(49):自立(0):イイ
>> 名詞(2):一般(0):テンキ
>> 助動詞(71):助動詞(0):デス

  こちらの ChaSen 2.02 でも同じ結果になります。

>> 仕様変更にしても番号の割り当て方がおかしいような気がするのですが、イ
>> ンストールに問題があるのでしょうか。

  /usr/share/doc/chasen/manual-j.tex.gz によると、%b に関しては v-gram 
の場合常に 0 になるそうです。%h に関しては、grammar table から読みとっ
た値をそのまま使っているようなので(source code より確認)、そういう仕様
なのだと思います。

# 自分自身きちんと ChaSen の動作原理を理解してませんが...
-- 
野首 貴嗣
E-mail: knok@xxxxxxxxxxxxx (private)
        nokubi@xxxxxxxxx (official)