[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[debian-devel:11721] Re: new search engine for our web pages? [was:masayuki-h@xxxxxxxxxxxxxxx: Re: ITP: namazu2]



こんばんは

>>>>> In article <200002221026.TAA12825@xxxxxxxxxxxx>,
>>>>> "NT" == knok@xxxxxxxxxxxxx (NOKUBI Takatsugu) <debian-devel@debian.or.jp> wrote...
> 例えば Debian の Web Page tree
> 全体 (www.jp.debian.org でミラーしてますよね) で index 作成すると
> どれくらいかかるものなんでしょう ?

NT>   ちょうど、北目さんが namazu2 に移行する作業をするそうなので、ついで
NT> に大体の時間を計測してもらえるといいかも。

さきほど移行おわりました。
ついでに Debian Project のメーリングリストを増やしたり、オマケもつけて
あります。
Debian Project のメーリングリストはもう少し増やすつもりです。

で、indexing の時間ですが...
 Kakasi が Perl module ではないので、これよりさらに改善があるでしょう。
 ただし、Debian Project のメーリングリストや BTS はそもそも KAKASI を使って
 いない(英語だから)ので、これ以上の改善はないと思います。

ということをふまえて、一部だけ。
とくにオプションはつけてません。(--mhonarcを必要なものだけ)

debian-users-jp
サイズ (bytes):      90,384,962
合計の文書数:        20,800
合計キーワード数:    413,239
経過時間 (秒):       5,805
ファイル/秒:         3.58

debian-devel.jp
サイズ (bytes):      54,418,491
合計の文書数:        11,642
合計キーワード数:    328,629
経過時間 (秒):       3,062
ファイル/秒:         3.80

BTS
Size (bytes):        139,887,588
Total Documents:     16,748
Total Keywords:      1,352,486
Time (sec):          12,566
File/Sec:            1.33

debian-devel.org
Size (bytes):        281,988,180
Total Documents:     60,399
Total Keywords:      579,385
Time (sec):          16,163
File/Sec:            3.74

topics-ml
サイズ (bytes):      2,422,614
合計の文書数:        534
合計キーワード数:    49,667
経過時間 (秒):       302
ファイル/秒:         1.77

debian-user
Size (bytes):        363,076,366
Total Documents:     89,959
Total Keywords:      743,521
Time (sec):          27,283
File/Sec:            3.30

jp-policy
サイズ (bytes):      1,085,769
合計の文書数:        188
合計キーワード数:    14,254
経過時間 (秒):       93
ファイル/秒:         2.02

以上です...
-- 
Takuo KITAME / kitame@xxxxxxxxxxxx
   - It was a dark and stormy night... -