Suchqualität verbessern

Die Suchqualität bezieht sich auf die Qualität der Suchergebnisse in Bezug auf Ranking und Erinnerung, wie sie vom Nutzer, der die Suchanfrage ausführt, wahrgenommen wird.

Rangfolge bezieht sich auf die Reihenfolge der Elemente und Recall auf die Anzahl der abgerufenen relevanten Elemente. Ein Element (auch als Dokument bezeichnet) ist ein digitaler Inhalt, der von Google Cloud Search indexiert werden kann. Zu den Elementtypen gehören Microsoft Office-Dokumente, PDF-Dateien, eine Zeile in einer Datenbank, eindeutige URLs usw. Ein Element besteht aus folgenden Komponenten:

  • Strukturierte Metadaten
  • Indexierbare Inhalte
  • ACLs

Cloud Search nutzt eine Vielzahl von Signalen, um Suchergebnisse, also die Elemente, die aus einer Suchanfrage resultieren, abzurufen und deren Ranking festzulegen. Sie können die Signale von Cloud Search über Einstellungen im Schema, über den Inhalt und die Metadaten des Elements (während der Indexierung) sowie über die Suchanwendung beeinflussen. Dieses Dokument soll Ihnen helfen, die Suchqualität durch Änderung dieser Signalbeeinflusser zu verbessern.

Eine Zusammenfassung der empfohlenen und optionalen Einstellungen finden Sie unter Zusammenfassung der empfohlenen und optionalen Einstellungen für die Suchqualität.

Aktualitätsfaktor beeinflussen

Aktualität bezieht sich auf die Relevanz eines Suchergebnisses für die ursprünglichen Suchbegriffe. Die Aktualität eines Elements wird anhand der folgenden Kriterien berechnet:

  • Die Bedeutung der einzelnen Suchbegriffe.
  • Die Anzahl der Treffer (die Häufigkeit, mit der ein Suchbegriff im Inhalt oder in den Metadaten des Elements vorkommt).
  • Der Typ von Übereinstimmungen mit dem Suchbegriff und seinen Varianten hat mit einem in Cloud Search indexierten Element.

Wenn Sie die Aktualität eines Textattributs beeinflussen möchten, können Sie RetrievalImportance für das Textattribut in Ihrem Schema definieren. Eine Übereinstimmung für eine Property mit einem hohen RetrievalImportance führt zu einer höheren Bewertung als eine Übereinstimmung für eine Property mit einem niedrigen RetrievalImportance-Wert.

Angenommen, Sie haben eine Datenquelle mit den folgenden Eigenschaften:

  • In der Datenquelle wird der Verlauf für Softwarefehler gespeichert.
  • Jeder Fehler hat einen Namen, eine Beschreibung und eine Priorität.

Die meisten Nutzer würden diese Datenquelle anhand des Fehlernamens abfragen. In diesem Fall würden Sie RetrievalImportance im Namen auf HIGHEST im Schema setzen.

Umgekehrt können die meisten Nutzer diese Datenquelle nicht anhand der Beschreibung des Fehlers abfragen. Setzen Sie daher RetrievalImportance in der Beschreibung auf DEFAULT. Im Folgenden finden Sie ein Beispielschema mit RetrievalImportance-Einstellungen.

{
  "objectDefinitions": [
    {
      "name": "issues",
      "propertyDefinitions": [
        {
          "name": "summary",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": HIGHEST
              }
            }
          },
        {
          "name": "description",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": DEFAULT
              }
            }
          },
        {
          "name": "label",
            "isRepeatable": true,
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": DEFAULT
              }
            }
          },
        {
          "name": "comments",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": DEFAULT
              }
            }
          },
        {
          "name": "project",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": HIGH
              }
            }
          },
        {
          "name": "duedate",
          "datePropertyOptions": {
          }
        },
        ...
      ]
    }
  ]
}

Bei HTML-Dokumenten werden Tags wie <title> und <h1> zusammen mit Formatierungseinstellungen wie Schriftgröße und Fettdruck verwendet, um die Bedeutung verschiedener Begriffe zu bestimmen. Wenn ContentFormat TEXT ist, hat ItemContent die Abrufwichtigkeit DEFAULT und wenn es sich um HTML handelt, wird seine Abrufwichtigkeit auf der Grundlage von HTML-Eigenschaften bestimmt.

Einflussaktualität

Die Aktualität misst, wann ein Element zuletzt geändert wurde. Sie wird durch die Attribute createTime und updateTime in ItemMetadata bestimmt. Ältere Elemente werden in den Suchergebnissen abgewertet.

Sie können die Berechnung der Aktualität eines Objekts beeinflussen, indem Sie freshnessProperty und freshnessDuration von FreshnessOptions im Schema anpassen.

Mit freshnessProperty können Sie anstelle des Standardwerts updateTime Datums- oder Zeitstempelattribute für die Berechnungsaktualität verwenden.

In unserem vorherigen Beispiel eines Softwarefehler-Tracking-Systems könnte das Fälligkeitsdatum als freshnessProperty verwendet werden, sodass Elemente mit einem Fälligkeitsdatum, das dem aktuellen Datum am nächsten liegt, als „frischer“ angesehen werden und ein Ranking-Boost erhalten. Hier sehen Sie ein Beispielschema mit freshnessProperty-Einstellungen:

{
  "objectDefinitions": [
    {
      "name": "issues",
      "options": {
        "freshnessOptions": {
          "freshnessProperty": "duedate"
        }
      },
      "propertyDefinitions": [
        {
          "name": "summary",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": HIGHEST
            }
          }
        },
        {
          "name": "duedate",
          "datePropertyOptions": {
          }
        },
        ...
      ]
    }
  ]
}

Mit freshnessDuration können Sie feststellen, ob ein Element als veraltet gilt. Das kann beispielsweise der Fall sein, wenn eine Datenquelle nicht regelmäßig indexiert wird oder bei der die Aktualität das Ranking nicht beeinflussen soll. Sie können dieses Ziel erreichen, indem Sie für freshnessDuration einen hohen Wert festlegen.

Angenommen, Sie haben eine Datenquelle mit Mitarbeiterprofilen. In diesem Szenario empfiehlt sich möglicherweise ein hoher Wert für freshnessDuration, da Änderungen an Mitarbeiterinformationen häufig nicht relevant für das Ranking des Mitarbeiters sind. Hier sehen Sie ein Beispielschema mit der Einstellung freshnessDuration:

{
  "objectDefinitions": [
    {
      "name": "people",
      "options": {
        "freshnessOptions": {
          "freshnessDuration": "315360000s", # 100 years
        }
      },
    }
  ]
}

Sie können freshnessDuration auch für Datenquellen, deren Inhalt sich schnell ändert, auf einen sehr kleinen Wert setzen, z. B. für eine Datenquelle mit Nachrichtenartikeln. In diesem Szenario sind die zuletzt erstellten oder geänderten Dokumente am relevantesten. Im Folgenden finden Sie ein Beispielschema mit der Einstellung freshnessDuration für eine Datenquelle mit sich schnell ändernden Inhalten:

{
  "objectDefinitions": [
    {
      "name": "news",
      "options": {
        "freshnessOptions": {
          "freshnessDuration": "259200s", # 3 days
        }
      },
    }
  ]
}

Qualität beeinflussen

Qualität ist ein Maß für die Genauigkeit und Nützlichkeit eines Elements. Eine Datenquelle kann mehrere semantisch ähnliche Dokumente enthalten, die jeweils ein anderes Qualitätsniveau haben. Mit SearchQualityMetadata können Sie einen Qualitätswert zwischen 0 und 1 angeben. Elemente mit höheren Werten erhalten im Vergleich zu Elementen mit niedrigeren Werten ein besseres Ranking. Verwenden Sie diese Einstellung nur, wenn Sie die Qualität eines Elements außerhalb der an Cloud Search bereitgestellten Informationen beeinflussen oder verbessern möchten.

Angenommen, Sie haben eine Datenquelle, die Dokumente zu Sozialleistungen enthält. Sie können SearchQualityMetadata verwenden, um das Ranking von Dokumenten, die von Mitarbeitern der Personalabteilung verfasst wurden, im Vergleich zu Dokumenten, die von anderen Mitarbeitern verfasst wurden, zu verbessern.

Das folgende Beispielschema enthält SearchQualityMetadata-Einstellungen für Probleme in einem Fehler-Tracking-System:

{
  "name": "datasources/.../items/issue1",
  "acl": {
    ...
  },
  "metadata": {
    "title": "Issue 1"
    "objectType": "issues"
  },
  ...
}

{
  "name": "datasources/.../items/issue2",
  "acl": {
    ...
  },
  "metadata": {
    "title": "Issue 2"
    "objectType": "issues"
    "searchQualityMetadata": {
      "quality": 0.5
    }
  },
  ...
}

{
  "name": "datasources/.../items/issue3",
  "acl": {
    ...
  },
  "metadata": {
    "title": "Issue 3"
    "objectType": "issues"
    "searchQualityMetadata": {
      "quality": 1
    }
  },
  ...
}

Wenn ein Nutzer anhand des Suchbegriffs „issue“ sucht, wird Problem 3 im Schema (Qualität 1) höher eingestuft als Problem 2 (Qualität von 0,5) und Problem 1 (wenn nichts angegeben ist, ist die Standardqualität 0).

Einfluss durch Feldtyp

Mit Cloud Search können Sie das Ranking basierend auf dem Wert von enum- oder Integer-Attributen beeinflussen. Für jedes Ganzzahl- oder Enum-Attribut kann ein OrderedRanking angegeben werden. Diese Einstellung hat folgende Werte:

  • NO_ORDER (Standard): Das Attribut wirkt sich nicht auf das Ranking aus.
  • ASCENDING: Elemente mit höheren Werten dieses ganzzahligen oder enum-Attributs erhalten ein Ranking-Boost im Vergleich zu Elementen mit niedrigeren Werten.
  • DESCENDING: Elemente mit niedrigeren Werten des Ganzzahl- oder enum-Attributs werden im Vergleich zu Elementen mit höheren Werten höher eingestuft.

Angenommen, jeder Programmfehler in einem System zur Nachverfolgung von Fehlern hat ein enum-Attribut zum Speichern der Priorität des Fehlers als HIGH (1), MEDIUM (2) oder LOW (3). In diesem Szenario erhöht das Festlegen von DESCENDING für OrderedRanking das Ranking von Fehlern mit der Priorität HIGH im Vergleich zu Programmfehlern mit Priorität LOW. Das folgende Beispielschema enthält OrderedRanking-Einstellungen für Probleme in einem Fehler-Tracking-System:

{
  "objectDefinitions": [
    {
      "name": "issues",
      "options": {
        "freshnessOptions": {
          "freshnessProperty": "duedate",
        }
      },
      "propertyDefinitions": [
        {
          "name": "summary",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": HIGHEST
            }
          }
        },
        {
          "name": "duedate",
          "datePropertyOptions": {
          }
        },
        {
          "name": "priority",
          "enumPropertyOptions": {
            "possibleValues": [
              {
                "stringValue": "HIGH",
                "integerValue": 1
              },
              {
                "stringValue": "MEDIUM",
                "integerValue": 2
              },
              {
                "stringValue": "LOW",
                "integerValue": 3
              }
            ],
            "orderedRanking": DESCENDING,
          }
        },

        ...
      ]
    }
  ]
}

Ein Fehler-Tracking-System könnte auch ein ganzzahliges Attribut mit dem Namen votes haben, mit dem Nutzer Feedback zur relativen Wichtigkeit eines Fehlers einholen können. Sie können das Attribut votes verwenden, um das Ranking zu beeinflussen, indem Sie den Bugs mit den meisten Stimmen eine höhere Bedeutung zuweisen. In diesem Fall können Sie OrderedRanking als ASCENDING für das Attribut votes angeben, damit Probleme mit den meisten Stimmen ein Ranking erhalten. Hier ein Beispielschema mit OrderedRanking-Einstellungen für Probleme in einem Fehler-Tracking-System:

{
  "objectDefinitions": [
    {
      "name": "issues",
      "propertyDefinitions": [
        {
          "name": "summary",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": HIGHEST
            }
          }
        },
        {
          "name": "description",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": DEFAULT
            }
          }
        },
        {
          "name": "votes",
          "integerPropertyOptions": {
            "orderedRanking": ASCENDING,
            "minimumValue": 0,
            "maximumValue": 1000,
          }
        },

        ...
      ]
    }
  ]
}

Ranking durch Suchanfragenerweiterung beeinflussen

Bei der Suchanfragenerweiterung werden Begriffe in der Suchanfrage durch Verwendung von Synonymen und Rechtschreibung erweitert, um bessere Ergebnisse zu erhalten.

Suchergebnisse mithilfe von Synonymen beeinflussen

In Cloud Search werden Synonyme aus öffentlichen Webinhalten verwendet, um die Suchbegriffe zu erweitern. Sie können auch benutzerdefinierte Synonyme definieren, um organisationsspezifische Terminologie zu erfassen, z. B. gängige Akronyme, die in einem Unternehmen verwendet werden, oder branchenspezifische Terminologie.

Benutzerdefinierte Synonyme können in einer Datenquelle oder als separate Datenquelle definiert werden. Standardmäßig werden Synonyme auf alle Datenquellen in allen Suchanwendungen angewendet. Sie können Synonyme jedoch nach Datenquelle und Suchanwendung gruppieren. Informationen zum Definieren benutzerdefinierter Synonyme sowie zum Gruppieren nach Suchanwendung finden Sie unter Synonyme definieren.

Suchergebnisse durch Rechtschreibung beeinflussen

Cloud Search bietet Rechtschreibvorschläge auf Grundlage von Modellen, die auf den öffentlichen Daten der Google Suche basieren. Wenn Cloud Search im Kontext einer Abfrage einen Rechtschreibfehler erkennt, wird die vorgeschlagene Abfrage in SpellResult zurückgegeben. Die vorgeschlagene Schreibweise kann dem Nutzer als Vorschlag angezeigt werden. Zum Beispiel könnte der Nutzer den Suchbegriff "employe" falsch geschrieben haben und die Fehlermeldung "Meinten Sie Mitarbeiter?" erhalten.

Cloud Search verwendet auch Rechtschreibkorrekturen als Synonyme, um Dokumente abzurufen, die andernfalls aufgrund eines Rechtschreibfehlers möglicherweise übersehen werden.

Ranking durch Einstellungen der Suchanwendung beeinflussen

Wie in der Einführung in Google Cloud Search erwähnt, besteht eine Suchanwendung aus einer Gruppe von Einstellungen, die in Verbindung mit einer Suchoberfläche Kontextinformationen zu Suchanfragen liefern. Mit den folgenden Konfigurationen können Sie das Ranking über die Suchanwendung beeinflussen:

  • Bewertungskonfiguration
  • Quellenkonfiguration

In den folgenden beiden Abschnitten wird erläutert, wie diese Konfigurationen das Ranking beeinflussen.

Bewertungskonfiguration anpassen

Für jede Suchanwendung können Sie eine ScoringConfig angeben, mit der die Anwendung einiger Signale während des Rankings gesteuert wird. Derzeit können Sie die Aktualität und die Personalisierung deaktivieren.

Wenn die Aktualität deaktiviert ist, wird sie für alle Datenquellen deaktiviert, die in der Suchanwendung aufgeführt sind, unabhängig von den Aktualitätsoptionen, die im Schema der Datenquelle angegeben sind. Ebenso wirken sich die Steigerung der Inhaber und der Interaktion nicht auf das Ranking aus, wenn die Personalisierung deaktiviert ist.

Eine detaillierte Anleitung zum Konfigurieren dieser Einstellung finden Sie im Hilfeartikel Suchfunktion in Cloud Search anpassen.

Quellkonfiguration anpassen

Mit der Quellkonfiguration können Sie in einer Suchanwendung Einstellungen auf Datenquellenebene festlegen. Die folgenden Einstellungen werden unterstützt:

  • Wichtigkeit der Quelle
  • Crowding

Wichtigkeit der Quelle festlegen

Die Wichtigkeit der Quelle bezieht sich auf die relative Bedeutung einer Datenquelle in einer Suchanwendung. Diese Einstellung kann im Feld SourceImportance innerhalb von SourceScoringConfig angegeben werden. Elemente aus einer Datenquelle mit der Quellenwichtigkeit HIGH werden im Vergleich zu Elementen aus einer Datenquelle mit der Quellenwichtigkeit DEFAULT oder LOW höher eingestuft. Verwenden Sie diese Einstellung, um das Ranking zu beeinflussen, wenn Sie glauben, dass Nutzer Ergebnisse aus bestimmten Datenquellen bevorzugen würden.

Angenommen, Sie haben ein Produktsupportportal mit externen und internen Fehlerbehebungsdaten. In diesem Szenario sollten Sie die Suchanwendung so konfigurieren, dass Ergebnisse aus der internen Datenquelle priorisiert werden.

Eine detaillierte Anleitung zum Konfigurieren dieser Einstellung finden Sie im Hilfeartikel Suchfunktion in Cloud Search anpassen.

Personenmenge festlegen

Crowding bezieht sich auf die maximale Anzahl von Ergebnissen, die von einer Datenquelle in einer Suchanwendung zurückgegeben werden können. Dieser Wert kann über das Feld numResults in SourceCrowdingConfig gesteuert werden. Der Standardwert ist „3“. Wenn also drei Ergebnisse aus einer Datenquelle angezeigt werden, zeigt Cloud Search jetzt Ergebnisse aus anderen Datenquellen an. Elemente der ersten Datenquelle werden nur dann neu berücksichtigt, wenn alle Datenquellen ihre Crowding-Grenze erreicht haben oder es keine weiteren Ergebnisse aus anderen Datenquellen gibt.

Diese Einstellung ist hilfreich, um für Vielfalt der Suchergebnisse zu sorgen und zu verhindern, dass eine Datenquelle die Suchergebnisseite dominiert.

Eine detaillierte Anleitung zum Konfigurieren dieser Einstellung finden Sie im Hilfeartikel Suchfunktion in Cloud Search anpassen.

Ranking durch Personalisierung beeinflussen

Personalisierung bezieht sich auf die Darstellung personalisierter Suchergebnisse basierend auf dem jeweiligen Nutzer, der auf das Ergebnis zugreift. Sie können das Ranking beeinflussen, indem Sie Elemente anhand der folgenden Kriterien priorisieren:

  • Eigentümerschaft an Elementen
  • Elementinteraktion
  • Nutzerklicks
  • Artikelsprache

In den folgenden drei Abschnitten erfahren Sie, wie Sie die Suchqualität anhand dieser Kriterien beeinflussen.

Ranking basierend auf den Eigentumsrechten eines Artikels beeinflussen

Eigentumsrechte an Elementen bezieht sich auf das Ranking von Elementen, die dem Nutzer gehören, der die Suchanfrage ausgeführt hat. Jedes Element hat eine ItemAcl mit einem owners-Feld. Wenn der Nutzer, der eine Abfrage ausführt, der Eigentümer eines Elements ist, erhält dieses Element standardmäßig ein Ranking-Boost. Sie können die Personalisierung in der Suchanwendung deaktivieren.

Ranking auf Grundlage der Elementinteraktion erhöhen

Elementinteraktion bezieht sich auf die Verbesserung des Rankings von Elementen, mit denen der Nutzer der Suchanfrage interagiert hat (Aufrufe, Kommentare, Bearbeitung usw.).

Für Google Workspace-Produkte wie Drive und Gmail werden automatisch Signale für die Elementinteraktion abgerufen. Bei anderen Produkten können Sie Interaktionsdaten auf Artikelebene angeben, einschließlich des Interaktionstyps (Ansehen, bearbeiten), Zeitstempel der Interaktion und des Hauptkontos (Nutzer, der mit dem Artikel interagiert hat). Beachten Sie, dass Elemente mit kürzlichen Interaktionen ein höheres Ranking erhalten.

Ranking basierend auf Nutzerklicks verbessern

Cloud Search erfasst die Klicks auf aktuelle Suchergebnisse und verwendet sie, um das Ranking bei zukünftigen Suchanfragen zu verbessern. Dazu werden die zuvor vom selben Nutzer angeklickten Elemente erhöht.

Ranking durch Interpretation der Suchanfrage beeinflussen

Die Cloud Search-Funktion zur Abfrageinterpretation interpretiert automatisch die Operatoren und Filter in der Nutzerabfrage und wandelt diese Elemente in eine strukturierte, Operator-basierte Abfrage um. Bei der Interpretation von Abfragen werden im Schema definierte Operatoren zusammen mit den indexierten Dokumenten verwendet, um abzuleiten, was die Abfrage des Nutzers bedeutet. Mit dieser Funktion können Nutzer mit wenigen Suchbegriffen suchen und erhalten dennoch präzise Ergebnisse. Weitere Informationen finden Sie unter Schema für optimale Abfrageinterpretation strukturieren.

Ranking anhand der Artikelsprache erhöhen

Sprache bezieht sich auf die Bereitstellung einer Ranking-Abwertung für Elemente, deren Sprache nicht mit der Sprache der Suchanfrage übereinstimmt. Die folgenden Faktoren beeinflussen das Ranking von Artikeln nach Sprache:

  • Die Abfragesprache. Die automatisch erkannte Sprache der Suchanfrage oder der in RequestOptions angegebene languageCode.

    Wenn du eine benutzerdefinierte Suchoberfläche erstellst, solltest du languageCode auf die Sprache oder Spracheinstellung des Nutzers festlegen, z. B. die Sprache des Webbrowsers oder der Seite der Suchoberfläche. Die automatisch erkannte Abfragesprache hat Vorrang vor languageCode, damit die Suchqualität nicht beeinträchtigt wird, wenn ein Nutzer eine Suchanfrage in einer Sprache eingibt, die von der Benutzeroberfläche abweicht.

  • Die Artikelsprache. Die bei der Indexierung in ItemMetadata festgelegte contentLanguage oder die von Cloud Search automatisch erkannte Inhaltssprache.

    Wenn das contentLanguage eines Dokuments zum Zeitpunkt der Indexierung leer gelassen und ItemContent ausgefüllt wird, versucht Cloud Search, die im ItemContent verwendete Sprache zu erkennen und intern zu speichern. Die automatisch erkannte Sprache wird nicht dem Feld contentLanguage hinzugefügt.

Wenn die Sprache der Suchanfrage und des Elements übereinstimmt, wird keine Sprachabwertung angewendet. Wenn diese Einstellungen nicht übereinstimmen, wird das Element herabgestuft. Die Sprachabwertung wird nicht auf Dokumente angewendet, bei denen contentLanguage leer ist und Cloud Search die Sprache nicht automatisch erkennen konnte. Wenn Cloud Search die Sprache eines Dokuments nicht erkennt, hat das keinen Einfluss auf das Ranking eines Dokuments.

Ranking basierend auf dem Elementkontext erhöhen

Sie können das Ranking von Elementen erhöhen, die für den Kontext einer Suchanfrage relevanter sind. Der Kontext (contextAttributes) besteht aus einer Reihe benannter Attribute, die Sie bei der Indexierung und in der Suchanfrage angeben können, um Kontext für eine bestimmte Suchanfrage bereitzustellen.

Angenommen, ein Element, z. B. ein Mitarbeiterleistungsdokument, ist im Kontext von Location und Department relevanter, z. B. eine Stadt (San Francisco), ein Bundesland (California), ein Land (USA) und ein Department (Engineering). In diesem Fall könnten Sie das Element mit den folgenden benannten Attributen indexieren:

{
  ...
  "metadata": {
    "contextAttributes": [
      {
        name: "Location"
        values: [
          "San Francisco",
          "California",
          "USA"
        ],
      },
      {
        name: "Department"
        values: [
          "Engineering"
        ],
      }
    ],
  },
  ...
}

Wenn ein Nutzer in der Suchoberfläche die Suchanfrage „Vorteile“ eingibt, können Sie die Standortinformationen und die Abteilung des Nutzers in die Suchanfrage aufnehmen. Hier sehen Sie beispielsweise eine Suchanfrage mit Standort- und Abteilungsinformationen für einen Entwickler in Chicago:

{
  ...
  "contextAttributes": [
    {
      name: "Location"
      values: [
        "Chicago",
        "Illinois",
        "USA"
      ],
    },
    {
      name: "Department"
      values: [
        "Engineering"
      ],
    }
  ],
  ...
}

Da sowohl der indexierte Artikel als auch die Suchanfrage die Attribute „Abteilung=Engineering“ und „Location=USA“ enthalten, wird der indexierte Artikel (ein Dokument über den Mitarbeitervorteil) in den Suchergebnissen weiter oben angezeigt.

Angenommen, ein anderer Nutzer, ein Entwickler in Indien, gibt die Suchanfrage "Vorteile" in die Suchoberfläche ein. Hier ist eine Suchanfrage mit Standort- und Abteilungsinformationen:

{
  ...
  "contextAttributes": [
    {
      name: "Location"
      values: [
        "Bengaluru",
        "Karnataka",
        "India"
      ],
    },
    {
      name: "Department"
      values: [
        "Engineering"
      ],
    }
  ],
  ...
}

Da sowohl der indexierte Artikel als auch die Suchanfrage nur das Attribut „Abteilung=Engineering“ enthalten, wird das indexierte Element in den Suchergebnissen nur geringfügig weiter oben angezeigt (im Vergleich zur ersten Suchanfrage nach „Vorteile“, die von einem Entwickler in Chicago, Illinois, USA eingegeben wurde).

Im Folgenden finden Sie einige Beispielkontexte, mit denen Sie das Ranking verbessern können:

  • Standort: Elemente können für Nutzer an einem bestimmten Standort relevanter sein, z. B. für ein Gebäude, eine Stadt, ein Land oder eine Region.
  • Rolle: Elemente können für Nutzer in einer bestimmten Position relevanter sein, z. B. technischer Redakteur oder Entwickler.
  • Abteilung: Elemente können für bestimmte Abteilungen relevanter sein, z. B. Vertrieb oder Marketing.
  • Position: Elemente können für bestimmte Positionen relevanter sein, z. B. Director oder CEO.
  • Mitarbeitertyp: Elemente können für bestimmte Arten von Mitarbeitern relevanter sein, z. B. Teilzeit- und Vollzeitmitarbeiter.
  • Dauer: Elemente können für die Dauer des Beschäftigungsverhältnisses relevanter sein, z. B. eine Neueinstellung.

Ranking durch Beliebtheit von Artikeln beeinflussen

Mit Cloud Search werden beliebte Elemente im Ranking verbessert, d. h. diejenigen, die in den letzten Suchanfragen Klicks erhalten haben.

Beeinflussung des Rankings durch Clickboost

Cloud Search erfasst die Klicks auf aktuelle Suchergebnisse und verwendet sie, um das Ranking bei zukünftigen Suchanfragen zu verbessern. Dazu werden beliebte Artikel für eine bestimmte Suchanfrage hervorgehoben.

Zusammenfassung der empfohlenen und optionalen Einstellungen für die Suchqualität

In der folgenden Tabelle sind alle empfohlenen und optionalen Einstellungen für die Suchqualität aufgeführt. Mit diesen Empfehlungen können Sie die Ranking-Modelle von Cloud Search optimal nutzen.

EinstellungStandortEmpfohlen/optionalDetails
Schemaeinstellungen
Feld ItemContentItemContentEmpfohlenFüllen Sie beim Erstellen oder Aktualisieren Ihres Schemas den unstrukturierten Inhalt eines Elements aus. Dieses Feld wird zum Generieren von Snippets verwendet.
Feld RetrievalImportanceRetrievalImportanceEmpfohlenLegen Sie beim Erstellen oder Aktualisieren eines Schemas Texteigenschaften fest, die eindeutig wichtig oder relevant sind.
FreshnessOptionsFreshnessOptionsOptionalLegen Sie beim Erstellen oder Aktualisieren eines Schemas fest, dass Elemente nicht aufgrund von fehlerhaften Daten oder fehlenden Daten herabgestuft werden.
Indexierungseinstellungen
createTime/updateTimeItemMetadataEmpfohlenWird während der Indexierung eines Elements ausgefüllt.
contentLanguageItemMetadataEmpfohlenWird während der Indexierung eines Elements ausgefüllt. Andernfalls versucht Cloud Search, die in ItemContent verwendete Sprache zu erkennen.
Feld ownersItemAcl()EmpfohlenWird während der Indexierung eines Elements ausgefüllt.
Benutzerdefinierte Synonyme_dictionaryEntry-SchemaEmpfohlenDefinition auf Ebene der Datenquelle oder als separate Datenquelle während der Indexierung.
Feld qualitySearchQualityMetadataOptionalLegen Sie die Qualität während der Indexierung fest, um im Vergleich zu anderen semantisch ähnlichen Elementen eine grundlegende Qualitätssteigerung zu erreichen. Wenn Sie dieses Feld für alle Elemente in einer Datenquelle festlegen, wird die Auswirkung aufgehoben.
Interaktionsdaten auf ArtikelebeneinteractionOptionalWenn in der Datenquelle die Interaktionen des Nutzers aufgezeichnet werden und Zugriff darauf ermöglicht wird, füllen Sie die Interaktionen für jedes Element während der Indexierung aus.
Ganzzahl-/Enum-AttributeOrderedRankingOptionalWenn die Reihenfolge der Elemente relevant ist, geben Sie die geordnete Rangfolge für Ganzzahl- und Enum-Attribute während der Indexierung an.
Einstellungen der Suchanwendung
Personalization=falseScoringConfig oder über die CloudSearch-Administrator-UIEmpfohlenBeim Erstellen oder Aktualisieren der Suchanwendung. Achten Sie darauf, die richtigen Informationen zum Inhaber anzugeben, wie unter „Ranking durch Personalisierung beeinflussen“ beschrieben.
Feld SourceImportanceSourceCrowdingConfigOptionalLegen Sie dieses Feld fest, um die Ergebnisse bestimmter Datenquellen zu gewichten.
Feld numResultsSourceCrowdingConfigOptionalLegen Sie dieses Feld fest, um die Vielfalt der Ergebnisse zu steuern.

Nächste Schritte

Als Nächstes könnten Sie Folgendes tun:

  1. Schema für eine optimale Abfrageinterpretation strukturieren

  2. Hier erfahren Sie, wie Sie mit dem _dictionaryEntry-Schema Synonyme für Begriffe definieren, die in Ihrem Unternehmen häufig verwendet werden. Informationen zur Verwendung des _dictionaryEntry-Schemas finden Sie unter Synonyme definieren.