[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
[debian-devel:18490] Re: [Q] 日本語形態素解析関連なパッケージを git.debian.org の collab-maint に置くのはどうか
こんばんは
On Wed, Jan 09, 2013 at 11:37:18AM +0900, NOKUBI Takatsugu wrote:
>
> とりあえずpkg-chasenを作ろうと思っていたんですが、辞書はほかのソフト
> で使われることもありますし、確かに日本語処理全体として面倒をみた方がよ
> さそうですね。
>
> At Sun, 6 Jan 2013 16:57:58 +0900,
> Hideki Yamane wrote:
> > やまねです。
> >
> > 手元にある日本語形態素解析関連なパッケージを git.debian.org の collab-maint
> > (あるいはaliothに別途チーム作る)に置くのはどうか、と思いたちました。
> > みなさんのご意見を伺いたく。
>
> 反対もなさそうなので次はaliothにプロジェクト申請をするフェーズでしょ
> うか。名前はどうするとよいでしょうね。
open-jtalkも含めて考えると、「自然言語処理」を「日本語中心」で議論するので
以下はいかがでしょうか?
* pkg-nlpj (Natural Language Processing, Japanese)
色々考えてみました。
* pkg-mecab
* pkg-chasen
まあ、最初はこのどっちかとも思いました。でもカバー範囲が狭く、優劣付けられません。
open-jtalkも含めて考えると、「自然言語処理」なので以下も考えました。
* pkg-nlp (Natural Language Processing)
実は、NLPを記述に含むパッケージを見ると、 timbl frog などが
scienceのカテゴリーにあります。メンテナーは、
Debian Science Team <debian-science-maintainers@lists.alioth.debian.org>
です。オランダ語用のようですが、英語主体の議論でメンテされるのでしょう。
またチョット毛色が違いますが、中国語にはopencc (繁体・簡体自動変換)
のソフトがあります。
英語のlink-grammar-dictionaries-en espeak apertium-tolk lttoolbox mmorph
なんてソフトもあります。
将来あるかもしれない韓国語・中国語・英語の類似プロジェクトと重ならないので。
日本語中心で運営するということで、pkg-nlpjがいいのではないでしょうか?とい
う事になっています。
青木