[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
[debian-users:48763] illegal character (gedit)
渡辺と申します。
Sarge でシステムのロケーションを UTF-8 にする過程で
遭遇した事例について教えて頂きたい事があります。
ディレクトリ毎に、ドットファイル以外のファイルについて、
find . -name "*.*" -print0 | xargs -0 nkf -w -Lu --overwrite
で UTF-8 へ変換しています。
変換状況のチェックとしては
xemacs 、vi(vim)ともに EUC-JP, SJIS, UTF-8 のいずれにも
対応し、文字化けが起こらないため、gedit を使っています。
ここで奇妙な現象(私にとりましては)に出くわしました。
EUC-JP や SJIS の書類は gedit で読むと現在までのところ
100%文字化けしています。とりあえずそれは当然の事としても、
UTF-8 に変換すれは文字化けしないはずですね。実際多くのファイルは
UTF-8 に変換後は文字化けせずに読めるのですが、中に文字化けするもの
がいくつか出て来ます。
奇妙なのはその文字化けしたファイル、"hoge.txt" を、
"hoge_2.txt" と名前を変えると文字化けせずに読めます。
gedit のバージョンは 2.8.3 なのですが、
原因が分かりません。
別に実害があるわけではない(と思います)が、
もしどなたかそのへんの事情をご存知の方いらっしゃいましたら
教えて頂けませんでしょうか?