[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: samba-doc-ja パッケージ



小林です。

From: TAKAHASHI Motonobu
Subject: Re: samba-doc-ja パッケージ
Date: Tue, 9 Oct 2007 00:12:52 +0900

> たかはしもとのぶです。
> 
> > >     * デフォルト値、設定例、といった文言は、xslt/expand-smbconfdoc.xsl を直接編集しています。
> > >     * Note や Warning といった文字列を日本語化する方法が確認できていません。
> > >     * デフォルトでは、日本語文字列が、すべて実体参照(&#xxx形式)になってしまいますので、HTML はまだしも、manpage 形式では使い物になりません。仕方ないので、以下のような PHP スクリプトで変換掛けてます。 
> > 
> > 数値実体参照になるのは出力エンコーディングを指定していないだけの気がします。
> > http://dolphin.c.u-tokyo.ac.jp/~nori1/w/?cmd=view;name=Log200604#2006-04-22
> 
> うーん、いちおう 
> 
> <xsl:output method="xml" encoding="EUC-JP" omit-xml-declaration="yes"/>
> 
> みたいに encoding を指定しているところを全て UTF-8 から EUC-JP に変え
> てみたのですが、いまのところ実体参照で出力されてしまう状況は直ってませ
> ん。

「全て」とかではなくて、具体的に示していただけないでしょうか。DocBook
XSL のバージョンがいくつで、どのような設定でビルドが行われているか、と
いうのが最も重要なので。

ついでに、(DocBook XML ファイルはどうにかなるとして) XSLT の完全なコー
ドを示してもらえると他の講読者がテストできるのでありがたいです。

> > とはいえ、その指定方法やデフォルト出力エンコーディングが変わったりして
> > いるので、エンコーディングをどう指定しているかや DocBook XSL のバージョ
> > ンが分からないと何も言えませんが……。
> 
> DocBook XSL のバージョンというのは
> 
> |<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform";
> |        xmlns:exsl="http://exslt.org/common";
> |        version="1.1">
> 
> の部分を指していると考えればよいのでしょうか。
> 
> # かなり無知ですみません。

違います。docbook-xsl パッケージとして提供される DocBook XSL というソ
フトウェアのバージョンです。DocBook XSL は、DocBook XML を HTML や 
manpage などに変換するための XSLT スタイルシート群を提供します。

> ちなみにコンパイルしているのは sarge で、DocBook 関連のツールは、パッ
> ケージ以外のものはいれてません。

sarge なので docbook-xsl パッケージのバージョンは通常 (= etch などのパッ
ケージが混入していなければ) 1.68.1-0.1 ですよね (つまりソフトウェアの
バージョンとしては 1.68.1)。その sarge のバージョンだと、DocBook XSL 
の manpage モジュールのデフォルト出力エンコーディングは latin-1 になり
ます。なので日本語 XML ファイルを変換させた場合、エンコーディングの設
定がおかしければ数値実体参照だらけになります。まぁ、EUC-JP や UTF-8 で
設定をオーバーライドすれば問題なくなるはずですが…… (ただ、下のコメン
トで書いているように manpage として表示させたいときは Debian では今の
ところ EUC-JP にしなければならない)。

# etch のバージョンではデフォルト出力エンコーディングは UTF-8 ですが、
# etch の Debian では日本語の UTF-8 manpage がサポートされていないので、
# 出力 manpage はファイルとしては読めても manpage として man で表示さ
# せると文字化けします。ということでやはり今のところ (デフォルトの 
# UTF-8 ではなく) EUC-JP を指定する必要があります。

とりあえず manpage の出力エンコーディングの指定は、sarge では以下のと
おりになるはずです (前のメールで示した etch 用のものとは、パラメータ名
が変わります (chunker.output.encoding と man.output.encoding))。

<xsl:param name="chunker.output.encoding" select="'euc-jp'"/>
<xsl:output method="text"
            encoding="euc-jp"
            indent="no"/>

ちなみに、これからも暫くは sarge を使い続ける気でしょうか?
etch に移行すると上のとおり設定を変更しなければならないので、
上の設定の違いを覚えておかないとまたトラブルになりかねないのですが……。

-- 
|:  Noritada KOBAYASHI
|:  Dept. of General Systems Studies,
|:  Graduate School of Arts and Sciences, Univ. of Tokyo
|:  E-mail: nori1@xxxxxxxxxxxxxxxxxxxxxxx (preferable)
|:          nori@xxxxxxxxxxxxxxxxxxx
|:  Key fingerprint = AB26 9533 81DA 997B 3C06  4380 19BB ADA0 695C 9F53