[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [debian-devel:16950] ddtp 翻訳による description 文字化け



こんにちは

矢吹です。

(1) DDTPのデータベースに格納されている日本語は、UTF-8で格納されている
  と勝手に思っていましたが、EUC-JPで格納されているということですね。

(2) どなたかDDTPのデータベース中にある日本語が、EUC-JPで記録されているか
  UTF-8で記録されているかを確認された方はいらっしゃいますか?

DDTP中の日本語がEUC-JPだとすると、日本語だけUTF-8にコンバートできれば
いいけど、できなかったら全部の言語が合意するまで待ちになる可能性がある
ということ?

On Sat, 18 Aug 2007 11:16:42 +0900
Junichi Uekawa <dancer@xxxxxxxxxxxxx> wrote:

> こんにちは、
> 
> >  apt が ddtp 対応になって、description が日本語表示されるようになった
> >  …のですが、どうやら EUC-JP で格納されてるので、現状の UTF-8 環境だと
> >  文字化けを起こして判別ができません。
> 
> 問題の混同が起きているのでちょっと明確にしておきましょう。今回の問題は
> locale が UTF-8 になったからおきているわけではありません。
> 
> apt が i18n 機能のなかで、 DDTP のデータを iconv してから表示するように
> なったため問題がおきています。そのため、 locale が UTF-8 であろうと
> EUC-JP であろうと問題になります。
> 
> 
> locale が EUC-JP の場合:
> 
>        DDTPの元データを UTF-8 だとみなして、 iconv で EUC-JP に変換して画面に表示する。
>        (現在 元データが EUC-JP なので変換できない文字のところで表示がきれる)
> 
> 
> locale が UTF-8 の場合:
> 
>        DDTPの元データがUTF-8で出力もUTF-8なのでそのまま画面に表示する。
> 
>        (現在元データが EUC-JP なので画面にはEUC-JPで文字列が出力され、
>        普通の端末では表示できないことになる)
> 
> 
> なので、DDTPのサーバインフラ側として何が必要かというと、DDTPの元データ
> を UTF-8 に全部変換することです。
> 
> 
> 上川
> -- 
> dancer@{debian.org,netfort.gr.jp}   Debian Project
> 
> 


--
====+====+====+====+====+====+====+====+====+====+====+====+====+====+
Yukiharu Yabuki (矢吹幸治)                      I use Debian GNU/Linux
mail: yabuki@xxxxxxxxxxxxx
クレクレタコラは好き / クレクレタコだはイヤ
====+====+====+====+====+====+====+====+====+====+====+====+====+====+