トピック検索エンジンは、特定のトピックに重点を置いたエンジンです。特定のウェブサイトではなくウェブ全体を対象にします。プログラム可能検索エンジンでは、同じエンジンに複数のウェブサイトを含めることができます。この記事では、そのようなエンジンを構築して維持するための興味深い手法について説明します。
トピック別検索エンジンを構築する理由
標準の google.com 検索エンジンを使用して、適切なキーワードを選択し、検索演算子を使用して結果をフィルタリングすることで、正確で堅牢な検索を実行できます。ただし、一部のユーザーはこのような高度な手法に慣れていない可能性があります。ユーザーが操作しているコンテキストと検索のトピックがわかっているため、ユーザーに検索プロセスを案内して、選択したドメインにある貴重なリソースを簡単に見つけることができます。
高品質の Topical エンジンを構築するうえで有用な手法には、次のようなものがあります。
- キュレートされた検索サイト インデックス
- クエリの書き換え
- 検索結果への追加データの公開
キュレーション インデックス
検索キーワードがあいまいな場合や、コンテキストによって意味が異なる場合があります。関連性の高い質の高いサイトのみをエンジンに含めることで検索ドメインを絞り込むことができ、より的確で意味のある検索結果が得られます。
URL パターンを使用する
必要に応じて、URL パターンを使用してサイトの一部のみを検索してください。たとえば、html5rocks.com のサイトにあるブラウザの速度に関するチュートリアルのみを検索する場合は、検索するサイトで html5rocks.com/en/tutorials/speed/*
URL パターンを使用できます。
エンジンに追加するサイトの URL 構造が不明な場合は、google.com で site:
検索を実行して確認できます。たとえば、html5rocks.com の URL のサンプルを表示するには、google.com の検索ボックスに「site:www.html5rocks.com
」と入力します。
クエリの書き換え
対象ユーザーのことをよく理解していれば、ユーザーのクエリを予測し、パワー検索機能をユーザーの代わりに適用できます。元のクエリを書き直して追加の検索キーワードを追加したり、高度な検索演算子を使用したり、類義語を適用したりできます。
検索キーワードと演算子を追加する
他の検索キーワードの一般的な用途は、検索領域を表すキーワードの追加です(例: 太陽光発電の検索エンジンを表す「solar」など)。エンジンの特性に応じて、すべてのクエリまたは一部のクエリにのみ検索語句を追加できます。
コントロール パネルで、[検索機能] > [詳細] > [ウェブ検索の設定] > [クエリの追加] フィールドで、すべてのクエリに追加する検索キーワードを定義できます。
各絞り込みタブに異なる検索キーワードを追加することもできます。[検索機能] > [絞り込み] タブで、新しい絞り込みを追加し、[任意の単語] 欄に新たに追加した検索キーワードを入力します。ユーザーがエンジンでキーワードを検索して新しく作成したタブを選択すると、その絞り込みで追加された語句が含まれるようにクエリが書き換えられます。
ユーザーのコンテキストに応じてさまざまな語句を動的に追加すると便利な場合もあります。
プログラム可能な検索要素を使用している場合は webSearchQueryAddition
属性を使用して、そのような動的な追加語句を指定できます。JSON API を使用している場合は、orTerms
パラメータを使用します。
類義語の作成
類義語(検索語句のバリエーション)を使用して、ユーザーの検索クエリを拡張できます。エンジンで使用される可能性が高い語句の類義語を作成すると、ユーザーは複数のバリエーションを入力する必要がなくなります。つまり、代わりの検索語句はクエリに自動的に追加されます。
類義語は、コントロール パネルの [検索機能] > [類義語] で作成できます。また、類義語の作成に関するベスト プラクティスもご覧ください。
検索結果のカスタム レンダリング
プログラム可能検索エンジンはカスタマイズ性が高く、コントロール パネルのオプションを使用して検索結果の表示形式を変更できます。さらに、検索結果のカスタム マークアップを作成する場合は、より高度なカスタマイズ プロセスを実現できます。
たとえば、ユーザーのニーズに応じて、標準のタイトルとテキスト スニペット以外のデータを検索結果に表示したい場合があります。
構造化データとカスタム スニペットのレンダリングを使用して追加のデータを公開する
プログラム可能検索エンジンでは、テキスト スニペットに記載されていない情報について、より多くの情報を提供できます。たとえば、schema.org ボキャブラリを使用して、検索結果で参照しているサイトまたは URL がセマンティック マークアップを公開している場合、このデータは検索結果で pagemap属性として利用できます。<br class="ph-1-5
特定の URL で認識されている属性を確認するには、URL をリッチリザルト テストツールに貼り付けます。
抽出された属性は、この方法で表示できます。
Custom Search JSON API を使用している場合は、JSON レスポンス オブジェクトの items.pagemap
値でこれらの値にアクセスできます。
プログラム可能検索要素を使用している場合は、コールバックを使用して構造化データ情報をレンダリングできます。
結果をサードパーティ データでオーバーレイする
興味深い手法として、Custom Search JSON API を介してプログラムで結果を取得し、サードパーティのデータソースと結合して、エンドユーザーに付加価値を提供するという手法があります。
概要
トピック エンジンは、特定の分野で知識を広めるための非常に有効な手段であり、同じトピックに関心があるユーザーに多大な価値を提供します。サイトの適切にキュレートされたインデックスの作成と整理、特定のユースケースに対するユーザーの適切なクエリの作成、結果のカスタマイズにより、トピック エンジンは正しい情報を適切なタイミングで楽しく効率的に見つけられるようにします。