[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
[debian-users:31841] 縦書き PDF で pdftotext(または pdf2txt.pl)
- From: OHTAKE Kinya <ohtake@xxxxxxxx>
- Subject: [debian-users:31841] 縦書き PDF で pdftotext(または pdf2txt.pl)
- Date: Thu, 21 Feb 2002 17:05:15 +0900
- Organization: J-SYS
- X-face: "&]u["p**>d3C[&Jwd39B5{;;6%xQo&tjS0ds7pAin^HR+}.*J=Yupgbx.s1E))"CC}l&DJ rg6mSg;~5|R)0s`5wG?`6t4pVnc+Oa5~QB&eW\wGWhp.9cs*>A;lw>F"Bh2n`R.*k.DkJuP(K3[SvX ]v'RH7m;.Z9go$P>kJ7W(`^Xw.f^!(H!8vIW\*-i"<~<YQs;EmaeH1HP*=%@F
- X-face-version: X-Face utility v1.3.6.13 - "Eleanor Rigby (remix)"
- X-ml-info: If you have a question, send e-mail with the body "help" (without quotes) to the address debian-users-ctl@debian.or.jp; help=<mailto:debian-users-ctl@debian.or.jp?body=help>
- X-ml-name: debian-users
- X-mlserver: fml [fml 3.0pl#17]; post only (only members can post)
- Message-id: <4rkb5kg8@xxxxxxxxxxxxx>
- X-mail-count: 31841
- User-agent: Wanderlust/2.8.1 (Something) SEMI/1.14.3 (Ushinoya) FLIM/1.14.3 (Unebigorymae) APEL/10.3 MULE XEmacs/21.4 (patch 6) (Common Lisp) (i386-debian-linux)
大竹です。
NamazuでPDFを検索対象にしようとしているのですが、ちょっとこういう事
ができないかなぁと思いまして、皆様にお聞きしたいと思います。
文字が横方向に書かれているPDFファイルからの抽出は問題なくできます。
(PDFイメージ) (抽出されたテキスト)
あいうえお → あいうえお
文字が縦方向に書かれているものだと 1文字単位になってしまいます。
(PDFイメージ) (抽出されたテキスト)
あ あ
い い
う → う
え え
お お
何となく、そういうものでしようがないとは思うのですが、
(PDFイメージ) (抽出されたテキスト)
あ
い
う → あいうえお
え
お
みたいにはできないものかと思いまして。
こういった事は無理でしょうか?
--
OHTAKE Kinya mailto:ohtake@xxxxxxxx