[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[debian-devel:18490] Re: [Q] 日本語形態素解析関連なパッケージを git.debian.org の collab-maint に置くのはどうか



こんばんは

On Wed, Jan 09, 2013 at 11:37:18AM +0900, NOKUBI Takatsugu wrote:
> 
>   とりあえずpkg-chasenを作ろうと思っていたんですが、辞書はほかのソフト
> で使われることもありますし、確かに日本語処理全体として面倒をみた方がよ
> さそうですね。
> 
> At Sun, 6 Jan 2013 16:57:58 +0900,
> Hideki Yamane wrote:
> >  やまねです。
> > 
> >  手元にある日本語形態素解析関連なパッケージを git.debian.org の collab-maint
> >  (あるいはaliothに別途チーム作る)に置くのはどうか、と思いたちました。
> >  みなさんのご意見を伺いたく。
> 
>   反対もなさそうなので次はaliothにプロジェクト申請をするフェーズでしょ
> うか。名前はどうするとよいでしょうね。


open-jtalkも含めて考えると、「自然言語処理」を「日本語中心」で議論するので
以下はいかがでしょうか?

 * pkg-nlpj    (Natural Language Processing, Japanese)

色々考えてみました。

 * pkg-mecab
 * pkg-chasen

まあ、最初はこのどっちかとも思いました。でもカバー範囲が狭く、優劣付けられません。

open-jtalkも含めて考えると、「自然言語処理」なので以下も考えました。

 * pkg-nlp     (Natural Language Processing)

実は、NLPを記述に含むパッケージを見ると、 timbl frog などが
scienceのカテゴリーにあります。メンテナーは、
Debian Science Team <debian-science-maintainers@lists.alioth.debian.org>
です。オランダ語用のようですが、英語主体の議論でメンテされるのでしょう。

またチョット毛色が違いますが、中国語にはopencc (繁体・簡体自動変換)
のソフトがあります。

英語のlink-grammar-dictionaries-en espeak apertium-tolk lttoolbox mmorph
なんてソフトもあります。

将来あるかもしれない韓国語・中国語・英語の類似プロジェクトと重ならないので。
日本語中心で運営するということで、pkg-nlpjがいいのではないでしょうか?とい
う事になっています。

青木