On Tue, 16 Oct 2018 12:51:54 +0900, TSUCHIYA Masatoshi wrote:
- update-alternativeの処理をpostinst/prermに追加
- 任意のコミット、タグを指定してパッケージできるように
研究者としては,mecab-ipadic-NEologd として1バージョンしかインストールで きないのはちょっとつらいです.例えば,20171231 バージョンと 20180630 バー ジョンで比較試験したいなどの需要があります.
ああ、やはりそういう需要はありましたか。自分の中では別々のバージョンの パッケージを都度入れ変えて対応、ということを考えていたのですが、頻繁に 切り替えるのが大変なので別にしたほうが確かに良いですね。 個々のパッケージ名も合わせて変えないといけません。
(a) ダウンロード・ビルド・インストールを行うスクリプトのみのパッケージにする. (b) インストール先を /var/lib/mecab/dic/ipadic-neologd-YYYYMMDD/ のようにする. (c) /var/lib/mecab/dic/ipadic-neologd/ は最新へのシンボリックリンクにする.
というのはいかがでしょうか.
その方向で修正してみます。
On Wed, 17 Oct 2018 11:47:54 +0900, NOKUBI Takatsugu wrote:
(a) ダウンロード・ビルド・インストールを行うスクリプトのみのパッケージにする. (b) インストール先を /var/lib/mecab/dic/ipadic-neologd-YYYYMMDD/ のようにする. (c) /var/lib/mecab/dic/ipadic-neologd/ は最新へのシンボリックリンクにする.
というのはいかがでしょうか.
その方向で修正してみます。
(a), (b)までは実装しました。ただ、コマンドでgit repoのpull等の操作を やるようにできていません。
--date YYYY-MM-DD をオプションに指定するとその日に最も近いcommitから mecab-ipadic-neologd-YYYY-MM-DDという個別の(指定した日時をパッケージ名 に含む)パッケージとしてビルドするようにしました。
On Wed, 17 Oct 2018 16:19:00 +0900, NOKUBI Takatsugu wrote:
--date YYYY-MM-DD をオプションに指定するとその日に最も近いcommitから mecab-ipadic-neologd-YYYY-MM-DDという個別の(指定した日時をパッケージ名 に含む)パッケージとしてビルドするようにしました。
これだとseed/mecab-user-dict-seed*が存在しない状態をcheckoutしてしまう ことがあるので、任意のcommit hashもオプションから指定できるように してみます。 日付から当該ファイルが存在するcommitまで遡る方法が思いつかなかったので…
On Wed, 17 Oct 2018 16:19:00 +0900, NOKUBI Takatsugu wrote:
(a) ダウンロード・ビルド・インストールを行うスクリプトのみのパッケージにする. (b) インストール先を /var/lib/mecab/dic/ipadic-neologd-YYYYMMDD/ のようにする. (c) /var/lib/mecab/dic/ipadic-neologd/ は最新へのシンボリックリンクにする.
というのはいかがでしょうか.
その方向で修正してみます。
(a), (b)までは実装しました。ただ、コマンドでgit repoのpull等の操作を やるようにできていません。
(c)の実装もできました。あとはupdate-alternativesの処遇を考える必要が あるのですが… /var/lib/mecab/dic/ipadic-neologd を対象とすればいいかなとは思うの ですが、優先度はどれぐらいにするのがいいでしょうか。
* 既存の辞書より低め (20あたり) * unidicよりは低め (60-95あたり) * 既存の辞書より高め (100あたり)
以前に言語処理学会23回年次大会の公開された論文をで調べた結果では、 unidicよりは少ないけれどもよく利用されているという感じでした。 https://qiita.com/knok/items/9869d7093a4ddd46edb0 (この数字は若干正しくありません。「ipa辞書」というような表記の 論文をあとになって見つけたものの反映していません)