[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

eucJP conversion using debiandoc2html (Re: Packaging Manual 第14章)



佐野@浜松です。

In article <14382.46940.274403.26482Z@xxxxxxxxxxxxxxxxxxxxxxx>
 HAYASE Shigenori <shayase@xxxxxxxxxxxxxxx> さん writes:

> ところで、[debian-doc 01445] の
> 
> > 芳尾です。
> > 
> > http://www3.tky.3web.ne.jp/~shayase/debian/index.html
> > 
> > にある Packaging Manual JA のパッケージングをしているのですが、
> > EUC コードで書かれた SGML のソースコードを debiandoc2html で
> > 変換したものが、
> > \n\011
> > っつーコントロールコードが入ってまって、w3m でしか読めなくなって
> > しまっています。
> > #つーか試したのは Netscape と Lynx と w3m だけですが。
> > 
> > ack -c index.html でみてみると、
> > filename        code   kanji   kana kanji7  kana7    err  ascii   ctrl  other
> > index.html      euc     1236      0      0      0      0   5338    175      0
> > 
> > てなかんじになってしまってます。
> > 
> > どなたか対処方法をご存知ないですか?
> 
> は、どうなったんでしょうか? 他の sgml の邦訳版をパッケージ
> されている方はどうされているんでしょう?

私もこの件が気になってはいたのですが、ちょっと時間が無くて
反応できていませんでした。誰かわかる人はいますか ?

 debiandoc2stml (shell script) の中身を見たところ、

*)      nsgmlsi="$1"
        bn="`basename \"$1\" .sgml`"
        ;;
esac

case "$bn" in -*) bn="./$bn" ;; esac

tf1="$bn.sasp"
tf2="$bn.sasp-html"
tf3="$bn.sasp-html2"

nsgmls -l "$nsgmlsi" >"$tf1"
saspconvert size <"$tf1" >"$tf2"
saspconvert2 book <"$tf2" >"$tf3"
sgmlspl "$DEBIANDOCSGMLSPEC"/html "$bn.html/" <"$tf3"

となっていて、nsgmls, saspconvert, saspconvert2, sgmlspl を
使っているようですね。

「コントロールコードが入る」のは本文であれば、おそらく sgmlspl 
 (perl script) の中ではないかと思うのですが、ざっと見ただけなので
まだ詳細は調べてません。

ということでどなたかわかるかた、よろしくお願いします。

-- 
     # (わたしのおうちは浜松市、「夜のお菓子」で有名さ。)
    <xlj06203@xxxxxxxxxxx> : Taketoshi Sano (佐野 武俊)