2006年04月09日

クロール時間の短縮の考察

 こちらの記事 (→ クロール時間の短縮の検証) で判明した効果に対する考察です。

・SharePoint Portal Server 2003 のサードパーティのシングルスレッド IFilter を使用する場合、クロールは、クロール完了により長い時間かかります。


こちらの技術情報に記載の通り、再試行が発生する点と再試行までの間に待ち時間が発生するようで、これによってクロール時間が長くなるようです。 実際に、タスクマネージャで CPU 利用率を見ていると、マルチスレッドで動作する IFilter が処理している間は、CPU をほぼフルフル使っていますが、シングルスレッドで動作する IFiler が処理し始めると、途端に CPU はほとんど使われない状態が続きます。

つまり、PDF などのシングルスレッド動作の IFilter が対象とする ファイル数×(再試行+待ち時間) だけ、クロール時間が長くなってしまうということになります。

posted by kunitaka at 01:44| Comment(0) | TrackBack(0) | レポート
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。
この記事へのトラックバックURL
http://blog.sakura.ne.jp/tb/544733
※ブログオーナーが承認したトラックバックのみ表示されます。
※言及リンクのないトラックバックは受信されません。

この記事へのトラックバック