[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
[debian-devel:16880] XML での EUC-JP の扱い
こんにちは、
xml_grep で EUC-JP エンコーディングの xml ファイルを扱おうとして、下記
のエラーメッセージに遭遇し、調査していた所、おもっていたより深い問題の
ようなのでメールします。
$ xml_grep meetinglog/head/member 20070627.xml
Couldn't open encmap euc-jp.enc:
そのようなファイルやディレクトリはありません
at /usr/lib/perl5/XML/Parser.pm line 187
この根本原因は:
libxml-parser-perl のソースの
Parser/Encodings/Japanese_Encodings.msg
(1998年時点)にある内容で、euc-jp -> utf-8 のマッピングが一意でないた
め、euc-jp 用のコーディングは提供しない、という判断がそのまま残ってい
るようです。当時から10年たっているので状況が変わっていてもおかしくない
と思うのですが、現状どうあるべきか把握してらっしゃる方はいらっしゃいま
せんか?
現状のままで放っておくと perl 関連のツールでは UTF-8 以外の XML ファイ
ルが使えないということになるので困っています。
上川
--
dancer@{debian.org,netfort.gr.jp} Debian Project