[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
[debian-users:22762] sort and locale
フクイです。
日本語を含むファイルのコーディングとロケールの設定の組合わせに
よっては sort が正しく動作しない場合があることに気付きました。
以下のファイルを入力として使用するとします。
-------------
April 4月
December 12月
June June
August 8月
May May
September September
-------------
このファイルを euc で保存して sort に食わせます。
[ja_JP.ujis または japanese の場合]
-------------
% /usr/bin/sort test_euc.txt
June June
May May
September September
April 4月
August 8月
December 12月
-------------
ちなみに
-------------
% /usr/bin/sort -k 2 test_euc.txt
June June
May May
September September
December 12月
April 4月
August 8月
-------------
[ja または C の場合]
-------------
% /usr/bin/sort test_euc.txt
April 4月
August 8月
December 12月
June June
May May
September September
-------------
ファイルを JIS にすると上記のどのロケールでも正しくソートされます。
BTS に報告しようにも sort の問題とロケールの問題との切り分けが
よく分らないので、こちらでご意見を頂ければと思います。
使用しているのは potato で、各パッケージのバージョンは
ii textutils 2.0-2 The GNU text file processing utilities.
ii locale-ja 13 Locale definition files for Japanese.
ii locales 2.1.3-10 GNU C Library: National Language (locale) da
です。
+-----------------------------------------+
福居毅至
沖電気工業株式会社 研究開発本部
情報サービスシステムラボラトリ
E-mail: tfukui@xxxxxxxxxxxxxxxx
+-----------------------------------------+