[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[debian-devel:17210] Re: naist-jdic パッケージ



On Fri, 14 Mar 2008 18:03:02 +0900
NOKUBI Takatsugu <knok@xxxxxxxxxxxxx> wrote:

>   すみません、余裕がなくてまだパッケージをみれていません。ChaSenは辞書
> のencodingを変える必要あるんでしたっけ。とりあえずChaSen自身の入出力に
> 関してはいくつかのencodingをサポートしていますけれども。

 http://chasen-legacy.sourceforge.jp/ で以下のようにあったので、
 encoding の変換をしておきました。

> * UTF-8 は使えますか?
> 使えます。*.cha と *.dic を UTF-8 に変換して以下のようにすると UTF-8 の辞書ができます。
> $ `chasen-config --mkchadic`/makemat -i w
> $ `chasen-config --mkchadic`/makeda -i w chadic *.dic
> 
> chasenrc で変換した文法ファイルと辞書を指定し、茶筌本体にも UTF-8 で処理するようオプションを指定します。
> $ chasen -i w UTF8.txt
> 必要に応じて chasenrc も UTF-8 に変更してください。 


>   生成されるデータなので、/var/lib配下が適切だと思います。確か
> /usr/shareは書き換えされなくてかつarch independentであることが前提だっ
> たような気が。

 では、/var/lib/chasen/dic/naist-jdic/ に配置するようにしました。