[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[debian-users:55026] Re: 日本語 man ページのテキストファイル変換について



今日は

だいぶ前の投稿へのコメントでなんですが
用途にもよると思いますガ
単にmanページに相当する
同じような内容のテキストファイルを作って
それを何かで加工するということならば

/usr/share/man/ja/man& にある.gz付のファイルを解凍(gunzip ファイル名)すると
テキストファイルになるはずですが
それではだめなのですか。
私のところでやってみた限りでは
これで日本語部分にお化けがでることはありません。

そのかわり太字指定がBRという文字ででたりはしますが
テキストファイルですから仕方ありません。
そのファイルをemacsなどに読み込み
サーチ機能を使って、一括して消してしまえばよいわけです。
それで保存すればまともなテキストファイルになると思いますけれど。

その保存ファイルをさらに例えばPDFなどにするには
このファイルをabiwordに読み込んで加工できるはずです。
libreofficeを使う場合には、
いったんabiwordに読み込んでから
カットアンドペーストでlibreofficeに落します。

竹内雅文





On Tue, 4 Jan 2011 03:32:48 +0900
Shinichi Yamanaka <qgb00026@xxxxxxxxx> wrote:

> 
> 北海道の 山中 と申します。
> 日本語 man ページをテキストファイルに変換する方法について質問させてくだ
> さい。
> 
> 英語の man ページ(例えば ls)であれば
> 
> 	$ man 1 ls | col -b > ls.1.txt
> 
> で ls のマニュアルページをテキストファイルに変換できますが、この方法で日
> 本語のマニュアルページををテキストファイルに変換すると、文字が化けたり空
> 白になったりして、日本語に変換できません。
> 
> 以前にもこのような質問があったのかもしれないと思い、
> debian-users Mailing List Archive
> (http://lists.debian.or.jp/debian-users/) のスレッドで Suject を眺めたの
> ですが、それらしきものは確認できませんでした。
> (過去の ML のデータは取得できなくなったのでしょうか?)
> 
> man のマニュアルページをよく見ると、-t オプション、-T オプションがあるの
> がわかり、
> 
> 	$ man -t 1 ls > ls.1.txt
> 
> で PostScript のファイルに変換できるのが分かりましたが、それをどのように
> すれば日本語のテキストファイルに変換できるのか見当がつきません。
> 
> http://packages.debian.org/ で PostScript 関連のパッケージを調べていくと、
> ghostscript パッケージの /usr/bin/ps2txt が気になりました。
> この /usr/bin/ps2txt は PostScript のファイルから日本語のテキストファイ
> ルに変換することが出来るんでしょうか?
> 
> 
> 日本語 man ページをテキストファイルに変換する方法についてご存知の方がお
> られましたら、アドバイスをお願いしたいと思います。
> 
> 現在の環境は、以下のとおりです。
> 	・Debian GNU/Linux 5.07 (lenny)
> 	・インストール状況:「標準構成」のみで、KDE や GNOME といった
> 	 デスクトップ環境はインストールしていません。
> 	・「標準構成」に追加してインストールしたのは、以下のパッケージ
> 	 のみです。
> 		apache2, apache2-utils ,ruby, libapache2-mod-ruby
> 		bind9
> 		ddclient
> 		deborphan
> 		postfix, mailutils-pop3d
> 		samba, samba-tools
> 		sudo
> 		telnetd
> 
> 以上、よろしくお願いいたします。
> 
> ------------------------------------------
> 山中 伸一 qgb00026@xxxxxxxxx
> 
> 
> 


-- 
Masa Takeuti <delphyne@xxxxxxxxxxxxxxxx>