(前回の記事はこちら)
米Googleが8月6日に企業向け検索アプライアンス「Google Search Appliance」の最新版を発表しました。
1台で1000万件のドキュメントをインデックス可能とするなどキャパシティを強化、パーソナライズ機能も加えた。管理者は、スコアポリシーを設定してユーザーグループごとに検索結果をパーソナライズできる。また、データソース、URL、日付に加え、メタデータに基づいた検索結果表示も可能となった。このほか、レポート機能も強化。セキュリティでは、Kerberosをネイティブでサポートした。カスタマイズ設定では3000万件以上への対応も可能。
出典:Enterprise Watch
http://enterprise.watch.impress.co.jp/cda/foreign/2008/08/07/13593.html
1,000万件のドキュメントというボリュームや、肝となるパーソナライズ機能について、いまいちピンとこない方もいらっしゃるかもしれません。一体、どうしてこのようなソリューションが必要とされているのでしょうか。
前回は、「アプライアンスとは何か」「検索アプライアンスとは」などについて下調べを行いました。では「なぜ検索アプライアンスが必要なのか」ということを考えてみます。
Google検索アプライアンスについては、導入事例が紹介されており、そこからニーズを汲み取ることができます。一部引用します。
Google検索アプライアンス 導入事例
社内のシステムでは、文書を登録する際にカテゴリを指定するようになっており、そのカテゴリによって目的の文書を絞り込むことができるようになっている。しかし実際には、登録時にカテゴリを間違ったり、登録するカテゴリが分からないため「その他」を指定するなど、カテゴリ指定の運用ルールは守られていないのが現状だった。(中略)「5分以上かかっている人が75%もいたという、驚くべき結果になりました。10分以上30分以内でも32%もいるので、一日中検索しているんじゃないかというぐらい、多くのユーザーが検索に時間を取られている実態が明らかになったのです」しかも、それだけ時間をかけて探しても結局見つからないことがあるという人が80%以上もいることも判明した。
前回と同様に、やはり膨大なコンテンツから欲しい情報が見つからない状況があり、いたずらに時間を消費していることが問題なのは明らかです。そして、その課題を解決するのが検索アプライアンスである、というのがGoogleのストーリーです。
ここで上記引用の「文書を登録する際にカテゴリを指定するようになっており」というところに注目します。そもそもは、文書に属性情報を付加して管理しようとしていましたが、実際の運用においては難しかったととれます。そのため、検索技術に解決を求めるという構造になっています。管理者にチューニングを要求するとしても、ユーザには利便性のみを追求するということです。
検索アプライアンスサービスは様々な種類が存在します。GoogleはGoogleのもつ検索技術とブランドを売りにしていますが、ほかの検索アプライアンスについても同様にそれぞれの検索技術を訴求しています。どの製品やサービスにしても、根底にあるのはユーザの求める利便性・高効率の提供にあると思われます。
クロスメディア研究会では9月25日(木)に「導入事例から学ぶ検索アプライアンス」と題した拡大ミーティングにて、Vivisimo社の「Velocity」という製品を取り上げます。検索アプライアンスについて学ぶうえで注目すべき技術が詰め込まれています。Vivisimo製品についてのレポートがありますのでご紹介します。
検索結果の自動分類によって情報活用のコストは削減できる
同社の提供する検索ソリューションは、クローラ、インデクサ、エンジンといった検索のコア部分を構成する「Velocity」、複数の検索エンジンやデータベースの検索結果を統合する「Contents Integrator」、検索結果を自動的に分類してユーザーに提示する「Clustering Engine」の3つの層から構成されている。これらをひとまとめにしたソリューションに加えて、各層を構成するコンポーネントの個別提供も行う。中でも、Vivisimo製品の大きな特徴となるのは、Clustering Engineによる、検索結果の自動分類機能だ。
ここでの検索結果の自動分類機能について、もう少し知りたいところです。次回に続きます。
関連記事:
「検索アプライアンス」とは何か(1)
「検索アプライアンス」とは何か(3)
関連イベント:
導入事例から学ぶ検索アプライアンス 〜これからのメディアビジネスでおさえておきたい技術動向〜
関連リンク:
クロスメディア研究会
2008/09/11 00:00:00