[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[debian-users:21684] Re: chasen 2.0



平尾と申します.

知り合いに ChaSen の開発者がいるので聞いてみました.
答えになっているかどうかはわかりませんが参考までに
どうぞ.

--------------------------------------------------------------------
> chasenを2.0にupgradeしたのですが、1.51の時と-Fオプションの%hや%bで
> 表示される品詞番号が異なるようです。

ChaSen 1.51 (bi-gram版)の品詞階層は二階層までで、品詞大分類の番号(%h)
それぞれに対し品詞細分類の番号(%b)がつけられています。
これに対し ChaSen 2.0 以降(v-gram版)の品詞階層は多階層で、品詞番号(%h)
は全階層を通して連番でつけられています。%b は常に 0 になります。

また、当然のことながら品詞一覧(dic/grammar.chasen, dic/grammar.cha)
が異なると、品詞番号と品詞名の対応も変わります。

ChaSen 2.0 以降では、
% chasen -lp
とすると、

0 BOS/EOS
1 名詞
2 名詞-一般
3 名詞-固有名詞
4 名詞-固有名詞-一般
5 名詞-固有名詞-人名
6 名詞-固有名詞-人名-一般
7 名詞-固有名詞-人名-姓
8 名詞-固有名詞-人名-名
9 名詞-固有名詞-組織
10 名詞-固有名詞-地域
11 名詞-固有名詞-地域-一般
...

のように、品詞番号と品詞名のリストが表示されますので、品詞番号と品詞名
の対応を知るのに役立つと思います。

なお、茶筌に関して分からないことがあれば、問い合わせ先 
chasen@xxxxxxxxxxxxxxxxxx にメールされるといいでしょう。
------------------------------------------------------------------