Улучшить качество поиска

Качество поиска относится к качеству результатов поиска с точки зрения ранжирования и запоминаемости, воспринимаемых пользователем.

Ranking is the order of items, and recall is the number of relevant items retrieved. An item (or document) is any piece of digital content Google Cloud Search can index, such as Microsoft Office documents, PDF files, database rows, or unique URLs. An item consists of:

  • Структурированные метаданные
  • Индексируемый контент
  • передние крестообразные связки

Cloud Search uses various signals to retrieve and rank results. You can influence these signals through settings in the schema, item content and metadata, and the search application. This document helps you improve search quality by modifying these signal influencers.

Сводную информацию о настройках см. в разделе «Сводка настроек качества поиска» .

Оценка актуальности влияния

Темальность — это релевантность результатов поиска поисковым запросам. Cloud Search рассчитывает темальность на основе следующих критериев:

  • Важность каждого поискового запроса.
  • Количество совпадений (как часто поисковый запрос встречается в контенте или метаданных).
  • Типы соответствия между поисковыми запросами и индексированными элементами.

Чтобы повлиять на показатель актуальности текстового свойства, определите параметр RetrievalImportance в вашей схеме. Совпадение со свойством с высоким значением RetrievalImportance приводит к более высокому показателю.

Например, если вы храните историю ошибок программного обеспечения, пользователи, скорее всего, будут искать информацию по названию ошибки. Установите параметр RetrievalImportance для имени на HIGHEST . Для описаний используйте DEFAULT .

{
  "objectDefinitions": [
    {
      "name": "issues",
      "propertyDefinitions": [
        {
          "name": "summary",
          "textPropertyOptions": {
            "retrievalImportance": { "importance": "HIGHEST" }
          }
        },
        {
          "name": "description",
          "textPropertyOptions": {
            "retrievalImportance": { "importance": "DEFAULT" }
          }
        }
      ]
    }
  ]
}

For HTML documents, tags like <title> and <h1> help determine term importance. If ContentFormat is TEXT , ItemContent uses DEFAULT importance. If it is HTML , importance depends on HTML properties.

Влияние на свежесть

Показатель актуальности (Freshity) измеряет, как давно был изменен элемент, используя createTime и updateTime в ItemMetadata . Более старые элементы имеют более низкий рейтинг.

You can influence freshness by adjusting freshnessProperty and freshnessDuration in FreshnessOptions . The freshnessProperty lets you use a custom date or timestamp instead of updateTime . For bugs, you might use a due date so items with dates closest to now rank higher.

{
  "objectDefinitions": [
    {
      "name": "issues",
      "options": {
        "freshnessOptions": { "freshnessProperty": "duedate" }
      }
    }
  ]
}

Use freshnessDuration to specify when an item is considered out-of-date. A high value, like 100 years, nullifies the freshness effect. This is useful for static data like employee profiles. For news, use a small value like three days.

Качество влияния

Quality measures an item's accuracy and usefulness. Specify a value between 0 and 1 using SearchQualityMetadata . Higher values boost ranking. For example, you might boost benefits documents authored by HR.

{
  "metadata": {
    "searchQualityMetadata": { "quality": 1.0 }
  }
}

Влияние с использованием типа поля

С помощью OrderedRanking вы можете влиять на ранжирование на основе свойств перечислений или целых чисел:

  • NO_ORDER (по умолчанию): Не влияет на ранжирование.
  • ASCENDING : Более высокие значения повышают рейтинг.
  • DESCENDING : более низкие значения повышают рейтинг.

Для определения приоритета ошибки используйте DESCENDING , если HIGH равно 1, а LOW равно 3. Для параметра votes используйте ASCENDING .

Влияние на ранжирование посредством расширения запроса

Расширение поискового запроса использует синонимы и орфографию для улучшения результатов.

Используйте синонимы

Cloud Search использует общедоступный веб-контент в качестве синонимов. Вы также можете определить собственные синонимы для терминологии, специфичной для вашей организации. См. раздел «Определение синонимов» .

Используйте орфографию

Cloud Search предоставляет орфографические подсказки в SpellResult . Он также использует исправления орфографии в качестве синонимов для поиска документов.

Рейтинг влияния через настройки поискового приложения

Приложение для поиска предоставляет контекстную информацию. Вы можете влиять на ранжирование, используя следующие настройки.

Настройте параметры подсчета баллов.

Укажите параметр ScoringConfig , чтобы отключить проверку актуальности или персонализацию . Отключение персонализации снимает бонусы за действия пользователя и за взаимодействие с сайтом . См. раздел «Настройка поиска» .

Настройте конфигурацию источника.

Укажите параметры на уровне источника данных:

  • Важность источника : Элементы из источника HIGH важности занимают более высокое место в рейтинге.
  • Ограничение количества результатов : Ограничивает количество результатов из одного источника (по умолчанию — 3) для обеспечения разнообразия.

Персонализация

Персонализация определяет приоритетность результатов в зависимости от пользователя:

  • Владение предметами : Повышает характеристики предметов, принадлежащих пользователю.
  • Взаимодействие с товарами : Повышает рейтинг товаров, которые пользователь недавно просматривал, редактировал или комментировал.
  • Клики пользователя : Поднимает в результатах поиска элементы, на которые пользователь кликал ранее. Не изменяйте URL-адрес результата, так как он используется для сбора этих данных.

Интерпретация запроса

The query interpretation feature converts user queries into structured, operator-based queries using schema definitions. This provides precise results even with minimal keywords. See Structure a schema for optimal query interpretation .

Язык элемента

Cloud Search понижает рейтинг элементов, язык которых не совпадает с языком запроса. Установите languageCode в RequestOptions в соответствии с предпочтениями пользователя.

Контекст элемента

Используйте contextAttributes для повышения рейтинга элементов, релевантных контексту запроса, таким как местоположение или отдел.

Популярность товара

Облачный поиск повышает позиции результатов поиска, отображая товары, на которые пользователи часто нажимают в последних запросах. Не изменяйте URL-адреса результатов поиска, так как они используются для отслеживания этих кликов.

Сводная информация о настройках качества поиска

В следующих таблицах представлено краткое описание настроек качества поиска:

Настройки схемы

Параметр Расположение Рекомендация Подробности
ItemContent ItemContent Рекомендуется Актуальность
RetrievalImportance RetrievalImportance Рекомендуется Актуальность
FreshnessOptions FreshnessOptions Необязательный Свежесть

Настройки индексирования

Параметр Расположение Рекомендация Подробности
createTime / updateTime ItemMetadata Рекомендуется Свежесть
contentLanguage ItemMetadata Рекомендуется Язык элемента
owners ItemAcl Рекомендуется Право собственности на предмет
Пользовательские синонимы _dictionaryEntry Рекомендуется Используйте синонимы
quality SearchQualityMetadata Необязательный Качество влияния
Данные о взаимодействии interaction Необязательный Взаимодействие элементов
OrderedRanking OrderedRanking Необязательный Тип поля

Поиск настроек приложения

Параметр Расположение Рекомендация Подробности
Отключить персонализацию ScoringConfig Рекомендуется Персонализация
Важность источника SourceCrowdingConfig Необязательный Исходная конфигурация
Переполненность SourceCrowdingConfig Необязательный Исходная конфигурация

Следующие шаги

  1. Создайте схему для оптимальной интерпретации запросов .
  2. Дайте определение синонимам .