[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
[debian-devel:11721] Re: new search engine for our web pages? [was:masayuki-h@xxxxxxxxxxxxxxx: Re: ITP: namazu2]
こんばんは
>>>>> In article <200002221026.TAA12825@xxxxxxxxxxxx>,
>>>>> "NT" == knok@xxxxxxxxxxxxx (NOKUBI Takatsugu) <debian-devel@debian.or.jp> wrote...
> 例えば Debian の Web Page tree
> 全体 (www.jp.debian.org でミラーしてますよね) で index 作成すると
> どれくらいかかるものなんでしょう ?
NT> ちょうど、北目さんが namazu2 に移行する作業をするそうなので、ついで
NT> に大体の時間を計測してもらえるといいかも。
さきほど移行おわりました。
ついでに Debian Project のメーリングリストを増やしたり、オマケもつけて
あります。
Debian Project のメーリングリストはもう少し増やすつもりです。
で、indexing の時間ですが...
Kakasi が Perl module ではないので、これよりさらに改善があるでしょう。
ただし、Debian Project のメーリングリストや BTS はそもそも KAKASI を使って
いない(英語だから)ので、これ以上の改善はないと思います。
ということをふまえて、一部だけ。
とくにオプションはつけてません。(--mhonarcを必要なものだけ)
debian-users-jp
サイズ (bytes): 90,384,962
合計の文書数: 20,800
合計キーワード数: 413,239
経過時間 (秒): 5,805
ファイル/秒: 3.58
debian-devel.jp
サイズ (bytes): 54,418,491
合計の文書数: 11,642
合計キーワード数: 328,629
経過時間 (秒): 3,062
ファイル/秒: 3.80
BTS
Size (bytes): 139,887,588
Total Documents: 16,748
Total Keywords: 1,352,486
Time (sec): 12,566
File/Sec: 1.33
debian-devel.org
Size (bytes): 281,988,180
Total Documents: 60,399
Total Keywords: 579,385
Time (sec): 16,163
File/Sec: 3.74
topics-ml
サイズ (bytes): 2,422,614
合計の文書数: 534
合計キーワード数: 49,667
経過時間 (秒): 302
ファイル/秒: 1.77
debian-user
Size (bytes): 363,076,366
Total Documents: 89,959
Total Keywords: 743,521
Time (sec): 27,283
File/Sec: 3.30
jp-policy
サイズ (bytes): 1,085,769
合計の文書数: 188
合計キーワード数: 14,254
経過時間 (秒): 93
ファイル/秒: 2.02
以上です...
--
Takuo KITAME / kitame@xxxxxxxxxxxx
- It was a dark and stormy night... -