[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[debian-users:31868] Re: 縦書き PDF で pdftotext( または pdf2txt.pl)



大竹です。

At Fri, 22 Feb 2002 16:39:28 +0900,
knok@xxxxxxxxxxxxx (NOKUBI Takatsugu) wrote:
> 
>   一般的に問題になるのなら Namazu 側での対応も検討する必要があると思い
> ますので、自分でも探してみます。

今現在、"pdftotext"の使用は止めて、"pdf2txt.pl"というものを
使っています。(後者のURL失念)
なので、debian-users-MLの話題としてはそぐわない感じにはなって
ますが...

"pdf2txt.pl"にした理由は、句読点、記号、長音などが"pdftotext"
ではスペースに置き換えられてしまうからです。
で、前者の方が改造しやすいという理由です。
# もう改造も済んでうまくいっているようですし。

本来ならば、きちんとPDFの仕様を理解した上でちゃんとした対応
をすべきとは思うのですが、何分時間が無くて... (;_;)
-- 
OHTAKE Kinya    mailto:ohtake@xxxxxxxx