[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
[debian-devel:17210] Re: naist-jdic パッケージ
On Fri, 14 Mar 2008 18:03:02 +0900
NOKUBI Takatsugu <knok@xxxxxxxxxxxxx> wrote:
> すみません、余裕がなくてまだパッケージをみれていません。ChaSenは辞書
> のencodingを変える必要あるんでしたっけ。とりあえずChaSen自身の入出力に
> 関してはいくつかのencodingをサポートしていますけれども。
http://chasen-legacy.sourceforge.jp/ で以下のようにあったので、
encoding の変換をしておきました。
> * UTF-8 は使えますか?
> 使えます。*.cha と *.dic を UTF-8 に変換して以下のようにすると UTF-8 の辞書ができます。
> $ `chasen-config --mkchadic`/makemat -i w
> $ `chasen-config --mkchadic`/makeda -i w chadic *.dic
>
> chasenrc で変換した文法ファイルと辞書を指定し、茶筌本体にも UTF-8 で処理するようオプションを指定します。
> $ chasen -i w UTF8.txt
> 必要に応じて chasenrc も UTF-8 に変更してください。
> 生成されるデータなので、/var/lib配下が適切だと思います。確か
> /usr/shareは書き換えされなくてかつarch independentであることが前提だっ
> たような気が。
では、/var/lib/chasen/dic/naist-jdic/ に配置するようにしました。