[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[debian-devel:18604] RFS: travatar



こんにちは。赤部です。

機械翻訳システムの Travatar を ITP したのですが、どなたかスポンサーに
なって頂けませんか?

http://mentors.debian.net/debian/pool/main/t/travatar/travatar_0.1.0+git20131221-1.dsc

====
Package: wnpp
Severity: wishlist
Owner: Koichi Akabe <vbkaisetsu@xxxxxxxxx>

* Package name    : travatar
  Version         : 0.1.0+git20131219
  Upstream Author : Graham Neubig <neubig.at.gmail.com>
* URL             : http://www.phontron.com/travatar/
* License         : LGPL-3+
  Programming Lang: C++, Perl
  Description     : tree based machine translation toolkit

travatar is tree based statistical machine translation system containing
Tree-to-String (T2S) and Forest-to-String (F2S).

Tree based translation uses syntax trees of natural language and it's
particularly effective for language pairs that require a large amount of
reordering, such as English-Japanese translation.
====

Travatar は木ベースの統計機械翻訳システムで、学習されたモデルを使って原
文の構文木を翻訳先言語の文字列に変換します。木ベースの翻訳システムは、以
前から広く利用されているフレーズベースの翻訳システムに比べ、英日翻訳のよ
うな並べ替えの激しい言語間で効果的とされています。[1]

ただ、これは README.Debian にも書きましたが、実際に学習・翻訳を行うため
には、現時点で Debian に含まれていないソフトウェアを複数利用する必要があ
ります。

学習・翻訳に必要:
  構文解析器 (Stanford Parser, Berkeley Parser, Egret 等)
学習に必要:
  言語モデルツールキット (IRSTLM Toolkit 等)
  対訳文の単語対応(アラインメント)を取るツール (GIZA++, Nile 等)

このうち、IRSTLMについてはITPされています。[2] (苦戦しているようです
が...)
他についてもフリーソフトウェアなので、余裕があれば将来的にパッケージング
したいと思っています。

また、今 ftp-master/new で待機中の marisa [3] に依存しているので、
travatar のアップロードはこれが Accept されてからになります。

よろしくお願い致します。
赤部

[1] http://www.phontron.com/paper/neubig13acl-travatar.pdf
[2] http://bugs.debian.org/cgi-bin/bugreport.cgi?bug=671282
[3] http://ftp-master.debian.org/new/marisa_0.2.4-4.html

--
Koichi Akabe
 vbkaisetsu at {gmail.com, debian.or.jp}

Attachment: pgpcdVxEFEnCy.pgp
Description: PGP signature