[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
[debian-users:22533] Re: perl5 のソースがコンパイルできません
>>>>> In [debian-users : No.22526]
>>>>> Masashi Katsuno <katsuno-unix@xxxxxxxxxx> wrote:
M.K.> Arafuneさん、こんにちは。
M.K.> At 12:31 00/05/24 , you wrote:
M.K.> >M.K.> #
M.K.> たいしたことじゃないんですが、入力された日本語を提携パターンである程度編集し
M.K.> たかったりします。とは言っても、別に文法解析なんて高等なことじゃなくて、例え
M.K.> ば法人の表記を「株式会社」か「(株)」で統一したいとか、振り仮名をひらがなかカ
M.K.> タカナのどっちかで統一したいとか、そんなレベルです。「そんなことライブラリと
M.K.> か使えばいいじゃん」と言われてしまえばそれまでですが、組み込みの正規表現で処
M.K.> 理する方が個人的趣味に合うんです。
M.K.> そもそも、今回Jperlが必要になった(欲しくなった)同期は、標準の(EUCパッチをあ
M.K.> ててない)Perlだと正規表現の"[]"の中で漢字が使えないことでした。
M.K.> >jperl じゃないとできなくて perl ではできない事柄というのは何なんでしょうか?
M.K.> >
M.K.> >というか, jperl が必要な(絶対にjperl でなければならない)というような
M.K.> >状況はどんな状況なんでしょうか?(もともとのスクリプトが jperl が前提で
M.K.> >スクリプトを書き直す気力がないというのを除いての話ですが.)
M.K.> 「絶対に××じゃなきゃ」なんてことはないです。特にPerlだし…(^^;
M.K.> やろうと思えば何通りだってあるんでしょうけど、普通に組み込みの正規表現で日本
M.K.> 語扱えた方が楽だと思います。…っていうか、使えないと日本語のデータ処理には不
M.K.> 便じゃないですか ?
M.K.> ところで、不勉強で済みませんが、Jperl.pmって正規表現が使える文字列演算系の関
M.K.> 数を全部サポートしているんですか ?
してないと思います. Jperl はコード(日本語関係のが主)変換に用いるための
パッケージです.
で, euc にしてしまえば,あとは何とかなるということです.
M.K.> "s///"とか"tr///"とか"//"などで、正規表現で日本語を使えるのでしょうか。
euc なら普通におこなっても問題ない場合もありますが,そうでないこともあり
ます.
sjis とかだと私の能力ではどうしようもないのですが,一度ここでの文字コー
ドは euc だとわかってしまえば対処のしようはあるのです.
つまり文字コードを直接正規表現にかきこむ.
# もっとエレガントな方法があるかもしれませんが.
M.K.> あと、あまり関係ありませんが、C++のstringクラスなどで日本語の正規表現が使え
M.K.> る(要はPerlみたいな処理ができる)ライブラリってどこかにありませんでしょうか。
M.K.> もしご存知でしたら教えていただけると助かりますです。
M.K.> # jgrepはあるのにjperlは無いのが悲しかった… (^^;
ちゃんとしたことを言えば, jgrep だって Debian Official にはありません.
一時期これで@org にてもめたことがあります.
--
Ryuichi Arafune