[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[debian-users:22533] Re: perl5 のソースがコンパイルできません



>>>>> In [debian-users : No.22526] 
>>>>>	Masashi Katsuno <katsuno-unix@xxxxxxxxxx> wrote:
M.K.> Arafuneさん、こんにちは。

M.K.> At 12:31 00/05/24 , you wrote:
M.K.> >M.K.> # 
M.K.> たいしたことじゃないんですが、入力された日本語を提携パターンである程度編集し 
M.K.> たかったりします。とは言っても、別に文法解析なんて高等なことじゃなくて、例え 
M.K.> ば法人の表記を「株式会社」か「(株)」で統一したいとか、振り仮名をひらがなかカ 
M.K.> タカナのどっちかで統一したいとか、そんなレベルです。「そんなことライブラリと 
M.K.> か使えばいいじゃん」と言われてしまえばそれまでですが、組み込みの正規表現で処 
M.K.> 理する方が個人的趣味に合うんです。
M.K.> そもそも、今回Jperlが必要になった(欲しくなった)同期は、標準の(EUCパッチをあ 
M.K.> ててない)Perlだと正規表現の"[]"の中で漢字が使えないことでした。

M.K.> >jperl じゃないとできなくて perl ではできない事柄というのは何なんでしょうか?
M.K.> >
M.K.> >というか, jperl が必要な(絶対にjperl でなければならない)というような
M.K.> >状況はどんな状況なんでしょうか?(もともとのスクリプトが jperl が前提で
M.K.> >スクリプトを書き直す気力がないというのを除いての話ですが.)

M.K.> 「絶対に××じゃなきゃ」なんてことはないです。特にPerlだし…(^^;
M.K.> やろうと思えば何通りだってあるんでしょうけど、普通に組み込みの正規表現で日本 
M.K.> 語扱えた方が楽だと思います。…っていうか、使えないと日本語のデータ処理には不 
M.K.> 便じゃないですか ?

M.K.> ところで、不勉強で済みませんが、Jperl.pmって正規表現が使える文字列演算系の関 
M.K.> 数を全部サポートしているんですか ? 

してないと思います. Jperl はコード(日本語関係のが主)変換に用いるための
パッケージです.
で, euc にしてしまえば,あとは何とかなるということです.

M.K.> "s///"とか"tr///"とか"//"などで、正規表現で日本語を使えるのでしょうか。

euc なら普通におこなっても問題ない場合もありますが,そうでないこともあり
ます.
sjis とかだと私の能力ではどうしようもないのですが,一度ここでの文字コー
ドは euc だとわかってしまえば対処のしようはあるのです.
つまり文字コードを直接正規表現にかきこむ.
# もっとエレガントな方法があるかもしれませんが.


M.K.> あと、あまり関係ありませんが、C++のstringクラスなどで日本語の正規表現が使え 
M.K.> る(要はPerlみたいな処理ができる)ライブラリってどこかにありませんでしょうか。 
M.K.> もしご存知でしたら教えていただけると助かりますです。

M.K.> # jgrepはあるのにjperlは無いのが悲しかった… (^^;

ちゃんとしたことを言えば, jgrep だって Debian Official にはありません.
一時期これで@org にてもめたことがあります.

--
Ryuichi Arafune