[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[debian-devel:16880] XML での EUC-JP の扱い



こんにちは、

xml_grep で EUC-JP エンコーディングの xml ファイルを扱おうとして、下記
のエラーメッセージに遭遇し、調査していた所、おもっていたより深い問題の
ようなのでメールします。

$ xml_grep meetinglog/head/member 20070627.xml
Couldn't open encmap euc-jp.enc:
そのようなファイルやディレクトリはありません
 at /usr/lib/perl5/XML/Parser.pm line 187


この根本原因は:
libxml-parser-perl のソースの
Parser/Encodings/Japanese_Encodings.msg

(1998年時点)にある内容で、euc-jp -> utf-8 のマッピングが一意でないた
め、euc-jp 用のコーディングは提供しない、という判断がそのまま残ってい
るようです。当時から10年たっているので状況が変わっていてもおかしくない
と思うのですが、現状どうあるべきか把握してらっしゃる方はいらっしゃいま
せんか?


現状のままで放っておくと perl 関連のツールでは UTF-8 以外の XML ファイ
ルが使えないということになるので困っています。

上川
-- 
dancer@{debian.org,netfort.gr.jp}   Debian Project