[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[debian-users:22762] sort and locale



フクイです。

日本語を含むファイルのコーディングとロケールの設定の組合わせに
よっては sort が正しく動作しない場合があることに気付きました。

以下のファイルを入力として使用するとします。
-------------
April 4月
December 12月
June June
August 8月
May May
September September
-------------

このファイルを euc で保存して sort に食わせます。
[ja_JP.ujis または japanese の場合]
-------------
% /usr/bin/sort test_euc.txt
June June
May May
September September
April 4月
August 8月
December 12月
-------------

ちなみに
-------------
% /usr/bin/sort -k 2 test_euc.txt
June June
May May
September September
December 12月
April 4月
August 8月
-------------

[ja または C の場合]
-------------
% /usr/bin/sort test_euc.txt
April 4月
August 8月
December 12月
June June
May May
September September
-------------

ファイルを JIS にすると上記のどのロケールでも正しくソートされます。

BTS に報告しようにも sort の問題とロケールの問題との切り分けが
よく分らないので、こちらでご意見を頂ければと思います。

使用しているのは potato で、各パッケージのバージョンは
ii  textutils      2.0-2          The GNU text file processing utilities.
ii  locale-ja      13             Locale definition files for Japanese.
ii  locales        2.1.3-10       GNU C Library: National Language (locale) da
です。

+-----------------------------------------+
 福居毅至
 沖電気工業株式会社  研究開発本部
 情報サービスシステムラボラトリ
 E-mail: tfukui@xxxxxxxxxxxxxxxx
+-----------------------------------------+