[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[debian-users:48763] illegal character (gedit)



渡辺と申します。
Sarge でシステムのロケーションを UTF-8 にする過程で
遭遇した事例について教えて頂きたい事があります。

ディレクトリ毎に、ドットファイル以外のファイルについて、

find . -name "*.*" -print0 | xargs -0 nkf -w -Lu --overwrite

で UTF-8 へ変換しています。

変換状況のチェックとしては
xemacs 、vi(vim)ともに EUC-JP, SJIS, UTF-8 のいずれにも
対応し、文字化けが起こらないため、gedit を使っています。

ここで奇妙な現象(私にとりましては)に出くわしました。
EUC-JP や SJIS の書類は gedit で読むと現在までのところ
100%文字化けしています。とりあえずそれは当然の事としても、
UTF-8 に変換すれは文字化けしないはずですね。実際多くのファイルは
UTF-8 に変換後は文字化けせずに読めるのですが、中に文字化けするもの
がいくつか出て来ます。

奇妙なのはその文字化けしたファイル、"hoge.txt" を、
"hoge_2.txt" と名前を変えると文字化けせずに読めます。
gedit のバージョンは 2.8.3 なのですが、
原因が分かりません。
別に実害があるわけではない(と思います)が、
もしどなたかそのへんの事情をご存知の方いらっしゃいましたら
教えて頂けませんでしょうか?