[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[debian-users:03844] Re: Generate JE dictionary from gene.txt



From: Takashi Nishimoto <g96p0935@xxxxxxxxxxxxxxxx>
Subject: [debian-users:03836] Re: Generate JE dictionary from gene.txt
Date: Sun, 18 Jan 1998 21:15:57 +0900
Message-ID: <199801181215.VAA20767@xxxxxxxxxxxxxxxxxxxxxxxx>

> 西本です。
> 
> > gene.elをもじった方法でうまく行かない理由は、漢字コードの相違にあるようです。
> > Mule 内部では internal code という Mule 独自の文字コードを使用していますが、
> > これがわざわい(?)して、look の引数に渡した文字列も internal code になって
> > しまうので、漢字を look に渡すとうまく検索できません。
> そこら辺のことは、試験明けにでも試してみようかと思っています。
> 漢字コードっていろいろいじれるんじゃなかったっけ?C-xC-kなんとかで。

期待してます。

> > 欠点としては、大きな辞書になるほど初回の読み込みに時間がかかり、メモリーを食
> > うということでしょうか。3MB の辞書を読み込むと top 等で見た Mule の大きさが
> > 3MB 増加します。
> 
> うーむ、メモリの少ないマシンでは厳しいなぁ。

漢字コードの問題が解決すれば、同時に解決しますよね。

> > Nifty の FENG で配布されている「英辞郎」という 14MB 近くある辞書ファイルを変
> 
> インターネットでは入手できないのでしょうか?

「英辞郎」の README に以下のような記述があるので無理でしょう。

README 抜粋
-----------------------------------------------------------------------------
■■■■■■■■■■ 『英辞郎』は転載禁止です ■■■■■■■■■■■■■

英辞郎のファイルの全部または一部を他のフォーラムおよび/またはネットワーキ
ングシステムに転載することは禁じられています。(ニフティサーブから取得した
データをフロッピーディスクなどの媒体に記録して配布することは、「NIFTY-Serve
会員規約」の第12条により禁じられています)
-----------------------------------------------------------------------------
README 抜粋終り

#この規制のおかげでなかなか Nifty 止められない
#だから Nifty が生き残っているとも…

> > 換に掛けたところ、私の非力なマシン(P-5 100MHz Mem 40MB)で 6時間以上かかっ
> 
> 僕の主力ノートなんか、P5-120とはいえ、メモリはたった16MBですよ。
> デスクトップの方が遥かに性能が上ですが、レジューム機能の手軽さにより、
> デスクトップはサブに回ってしまいました。

実メモリ容量は関係ないかも知れません。このマシンは Swap 領域が 50M 取ってあり
ますが、途中で足りなくなりそうになったので swapfile を追加しました。
最終的に Swap を 90MB 近く消費してました。

でも gene.txt を変換するのには数分で変換が終りますので、十分じゃないでしょう
か。

> #HOWTOに関しては、和英も含めて、SKKによる「漢和辞典」も応用例として載
> せようかと思っています。jgrepで検索できますし。

こちらも期待しております。m(__)m
ではでは

-------
Soichiro Ohta
	E-Mail: s-oota@xxxxxxxxxxxxxxx

IN A WORLD WITHOUT FENCES...
WHO NEEDS GATES?