Mar 15, 2005   [去年の今ごろ]

サイト検索に msearch を導入してみた。

検索にかかる時間が長い

 このサイトのサイト内検索は Blosxom の find プラグインを用いて行っていた。エントリ数が 1000 を超えた現在では検索に数秒を要するようになった。これからエントリ数が増えればその時間も増えるだろう。サーバへの負荷も同様に。

 というわけで Blosxom ではなく 他の CGI から検索するようにしようと思い立った。

 まず、全文検索システム namazu の Perl 版である pnamazu をサーバのディレクトリに導入してみたがうまく動作しないのであきらめた。もう少し導入が簡単な CGI があるだろうと思い探していると msearch というインデックス型の検索システムを見つけることができた。

 msearch を Blosxom と併せて使うにあたって、

  1. ページタイトルの取得方法
  2. Blosxom 向け URL への変更

ば必要になる。1.について、msearch のスクリプトではページタイトルを HTML の <title> タグから取得しているが、ファイルの一行目をページタイトルとするようにした。2.について、msearch がインデックス作成時にファイル名から生成する URL を Blosxom の仮想URL に変換した。

 そして検索を実行してみると検索時間は大いに短縮された。

悩み

 しかしインデックス作成作業は人力でインデックス作成 CGI にアクセスして行わなければならないのがネック。WAKWAK のサーバでは telnet も cron の利用も許可されていないのだった。

検索してみる

この記事へのコメント

r:
google のサイト検索を使うとか。http://www.google.co.jp/intl/ja/searchcode.html
ogane:
ありがとう。このサイトに対する google のクロールがあまり多くないようでヒット率が低いのがネックでした。
gu:
超ogane2にパワーアップしたね。
 

コメントを書く

お名前:
コメント:

トラックバックURL: http://park18.wakwak.com/~ogane/cgi-bin/blosxom.cgi/computer/200503152334.trackback

Posted at 23:34 -  permalink -  category: コンピュータ -  tags: computer

これまでの記事。

2008 | 5 | 4 | 3 | 2 | 1 |
2007 | 12 | 11 | 10 | 9 | 7 | 6 | 5 | 4 | 3 | 2 | 1 |
2006 | 12 | 11 | 10 | 9 | 8 | 7 | 6 | 5 | 4 | 3 | 2 | 1 |
2005 | 12 | 11 | 10 | 9 | 8 | 7 | 6 | 5 | 4 | 3 | 2 | 1 |
2004 | 12 | 11 | 10 | 9 | 8 | 7 | 6 | 5 | 4 | 3 | 2 | 1 |
2003 | 12 | 11 | 10 | 9 | 8 | 7 | 6 | 5 | 4 | 3 | 2 | 1 |
2002 | 12 |