Themenklassifizierung

Lesen, wie Themen abgeleitet werden und wie sie Nutzern zugewiesen werden Browser und wie Nutzer ihre Themenliste verwalten können.

Implementierungsstatus

  • Die Topics API hat die öffentliche Diskussionsphase abgeschlossen und ist derzeit für 99 % der Nutzer verfügbar. Eine Skalierung auf bis zu 100 % ist möglich.
  • Wenn Sie Feedback zur Topics API geben möchten, können Sie in der Erläuterung zu Topics ein Problem erstellen oder in der Unternehmensgruppe zur Verbesserung der Webwerbung an Diskussionen teilnehmen. Sie enthält eine Reihe offener Fragen, die noch genauer definiert werden müssen.
  • Im Privacy Sandbox-Zeitplan finden Sie den Zeitplan für die Implementierung der Topics API und anderer Privacy Sandbox-Vorschläge.
  • Im Artikel Topics API: Neueste Updates finden Sie Informationen zu Änderungen und Verbesserungen der Topics API und deren Implementierungen.

Was ist ein Thema?

Ein Thema in der Topics API ist ein Thema, für das sich ein Nutzer interessiert. Dies lässt sich anhand der von ihm besuchten Websites belegen.

Themen sind ein Signal dafür, dass Anzeigentechnologie-Plattformen relevante Anzeigen auswählen können. Im Gegensatz zu Drittanbieter-Cookies werden diese Informationen weitergegeben, ohne dass weitere Informationen über den Nutzer selbst oder die Browseraktivitäten preisgegeben werden.

Mit der Topics API können Drittanbieter, z. B. AdTech-Plattformen, Themen, die einen Nutzer interessieren, beobachten und darauf zugreifen. Die API schlägt beispielsweise das Thema „Fiber & Textilkunst“ für einen Nutzer, der die Website knitting.example besucht.

Die Liste der von der Topics API verwendeten Themen ist öffentlich, von Menschen zusammengestellte und lesbare Themen und wurde entwickelt, um sensible Kategorien zu vermeiden. Dies ist die aktuelle Liste, die im Laufe der Zeit erweitert wird. Die Liste ist als Taxonomie strukturiert. Die Themen können grob oder spezifischer sein. Beispielsweise ist Food & Drink eine weit gefasste Kategorie mit der Unterkategorie Cooking & Recipes. Unterkategorien können in weitere Unterkategorien unterteilt werden.

Eine solche Taxonomie der Themen muss einen Kompromiss zwischen Nutzbarkeit und Datenschutz finden. Wenn Themen zu spezifisch sind, können sie dazu verwendet werden, einzelne Nutzer zu identifizieren. Sind sie zu allgemein, eignen sie sich nicht für die Auswahl von Werbung oder anderen Inhalten.

Bei der Thementaxonomie wurden zwei grundlegende Anforderungen berücksichtigt:

  • Interessenbezogene Werbung unterstützen
  • Nutzer schützen und ihre Privatsphäre schützen

Daraus ergeben sich mehrere Fragen. Beispiel:

  • Wie kann die API anhand der Browseraktivitäten am besten Themen ableiten, die für einen Nutzer von Interesse sein könnten, während gleichzeitig der Datenschutz für Nutzer gewahrt bleibt?
  • Wie könnte die Taxonomie strukturiert werden, um sie nützlicher zu machen?
  • Welche Elemente sollte die Taxonomie enthalten?

So leitet die API Themen für eine Website ab

Themen werden aus einem Klassifikatormodell abgeleitet, das Website-Hostnamen null oder mehr Themen zuordnet. Die Analyse zusätzlicher Informationen (z. B. vollständige URLs oder Seiteninhalte) kann relevantere Anzeigen ermöglichen, aber auch den Datenschutz verringern.

Das Klassifikatormodell für die Zuordnung von Hostnamen zu Themen ist öffentlich verfügbar. Wie in der Erläuterung beschrieben, ist es möglich, die Themen für eine Website über die Entwicklertools des Browsers aufzurufen. Es ist davon auszugehen, dass sich das Modell im Laufe der Zeit weiterentwickelt und verbessert und regelmäßig aktualisiert wird. die Häufigkeit dieser Probleme wird noch geprüft.

Nur Websites, die Code zum Aufrufen der Topics API enthalten, werden in den Browserverlauf aufgenommen, der für die Berechnung der Häufigkeit nach Themen infrage kommt. API-Aufrufer erhalten nur Themen, die sie beobachtet haben. Mit anderen Worten: Die Häufigkeitsberechnung nach Themen ist nur möglich, wenn die Website oder ein eingebetteter Dienst die API aufruft.

Außerdem kann ein Anrufer nur Themen empfangen, die sein Code "gesehen" hat. Wenn also der Code eines anderen Aufrufers ein Thema, z. B. /Autos & Vehicles/Motor Vehicles (By Type)/Hatchbacks, für den Browser eines Nutzers registriert hat und Ihr Code nicht dazu geführt hat, dass dieses Thema im Browser dieses Nutzers registriert wurde, können Sie dieses Thema für den Browser dieses Nutzers nicht erfahren, wenn Sie die API über Ihren eingebetteten Code aufrufen. Da die API jetzt Ancestors umfasst, die beobachtet wurden, würde das obige Beispiel (/Autos & Vehicles/Motor Vehicles (By Type)/Hatchbacks) auch dazu führen, dass Autos & Vehicles und Motor Vehicles beobachtet werden.

Die für einen Nutzer zurückgegebenen Themen werden in Abhängigkeit von der Top-Level-Website neu für einen Aufrufer berechnet. Wenn adtech.example die Themen des Nutzers beispielsweise am news-a.example, dann am news-b.example und dann am news-c.example anfordert, werden die an sie zurückgegebenen Themen auf jeder Website neu berechnet. Das bedeutet, dass ein Aufrufer wahrscheinlich verschiedene Themen für einen Nutzer auf verschiedenen Websites der obersten Ebene erhält, da die (maximal) drei zurückgegebenen Themen für einen Nutzer nach dem Zufallsprinzip aus den Top 5 der letzten drei Epochen ausgewählt werden (mit einer Wahrscheinlichkeit von 5 %, ein zufälliges Thema zu erhalten). Das macht es dem Aufrufer schwieriger, einen Nutzer anhand seiner Themen zu identifizieren, da diese wahrscheinlich auf verschiedenen Websites auf oberster Ebene unterschiedlich sein können (selbst für denselben Nutzer, Aufrufer und dieselbe Epoche).

Das Klassifikatormodell

Die Themen werden für 50.000 Top-Domains manuell zusammengestellt und mit dieser Auswahl wird der Klassifikator trainiert. Sie finden diese Liste in override_list.pb.gz, die nach dem aktuellen Modell auf dem Tab Klassifikator unter chrome://topics-internals/ verfügbar ist. Die Domain-zu-Themen-Verknüpfungen in der Liste werden von der API anstelle der Ausgabe des Modells selbst verwendet.

<ph type="x-smartling-placeholder">
</ph> Auf der Seite „chrome://topics-internals“ ist das Steuerfeld „Klassifikator“ ausgewählt.
Im Klassifikatorbereich der chrome://topics-internals-Seite werden die Modellversion, ihr Pfad und die Themen für jeden aufgeführten Host aufgelistet.

Informationen zum direkten Ausführen des Modells finden Sie in der TensorFlow-Anleitung zum Ausführen eines Modells.

Um die Datei override_list.pb.gz zu prüfen, müssen Sie sie zuerst entpacken:

gunzip -c override_list.pb.gz > override_list.pb

Verwenden Sie protoc, um sie als Text zu prüfen:

protoc --decode_raw < override_list.pb > output.txt

Eine vollständige Taxonomie der Themen mit IDs ist auf GitHub verfügbar.

Feedback oder Input zum Klassifikatormodell geben

Es gibt mehrere Kanäle, über die du Feedback zur Topics API geben kannst. Wenn Sie Feedback zum Klassifikatormodell benötigen, empfehlen wir Ihnen, ein GitHub-Problem zu senden oder auf ein vorhandenes Problem zu antworten. Beispiel:

So werden die fünf wichtigsten Themen des Nutzers ausgewählt

Die API gibt pro Epoche bis maximal drei Themen zurück. Wenn drei zurückgegeben werden, umfasst dies Themen für die aktuelle Epoche und die beiden vorherigen Epochen.

  1. Am Ende jeder Epoche stellt der Browser eine Liste von Seiten zusammen, die die folgenden Kriterien erfüllen: <ph type="x-smartling-placeholder">
      </ph>
    • Die Seite wurde während des Epochenzeitraums vom Nutzer besucht.
    • Die Seite enthält Code, der document.browsingTopics() aufruft.
    • Die API wurde aktiviert (z. B. nicht durch den Nutzer oder über einen Antwortheader blockiert).
  2. Der Browser auf dem Gerät des Nutzers verwendet das von der Topics API bereitgestellte Klassifikatormodell, um den Hostnamen für jede Seite einer Liste von Themen zuzuordnen.
  3. Der Browser sammelt die Liste der Themen.
  4. Der Browser erstellt eine Liste der fünf wichtigsten Themen nach Häufigkeit.

Die Methode document.browsingTopics() gibt dann ein zufälliges Thema aus den ersten fünf für jede Epoche zurück, mit einer Wahrscheinlichkeit von 5 %, dass eines dieser Themen zufällig aus der vollständigen Taxonomie der Themen ausgewählt wird. In Chrome können Nutzer auch einzelne Themen entfernen oder ihren Browserverlauf löschen, um die Anzahl der von der API zurückgegebenen Themen zu reduzieren. Nutzer können die API auch deaktivieren.

Auf der Seite chrome://topics-internals können Sie Informationen zu Themen ansehen, die während der aktuellen Epoche beobachtet wurden.

Wie die API entscheidet, welche Aufrufer welche Themen sehen

API-Aufrufer erhalten nur Themen, die sie kürzlich beobachtet haben. Die Themen für einen Nutzer werden nach jeder Epoche aktualisiert. Das bedeutet, dass die API ein rollierendes Fenster bereitstellt, in dem ein bestimmter Aufrufer bestimmte Themen empfangen kann.

In der folgenden Tabelle ist ein Beispiel für einen (wenn auch unrealistisch kleinen) hypothetischen Browserverlauf eines Nutzers während einer einzelnen Epoche aufgeführt. Es werden Themen im Zusammenhang mit den von ihm besuchten Websites und den API-Aufrufern der einzelnen Websites (die Entitäten, die document.browsingTopics() im auf der Website enthaltenen JavaScript-Code aufrufen) angezeigt.

Website Themen API-Aufrufer auf der Website
yoga.example Fitness adtech1.beispiel adtech2.beispiel
knitting.example Handwerk adtech1.example
wanderurlaub.beispiel Fitness, Reisen und Transportwesen adtech2.example
diy-clothing.example Handwerk, Mode und Stil [Keine]

Am Ende der Epoche (derzeit eine Woche) generiert die Topics API die Top-Themen des Browsers der Woche.

  • adtech1.example kann nun die Kategorie "Fitness" erhalten und „Crafts“ Themen behandelt, da sie sowohl auf yoga.example als auch auf stricken.example beobachtet wurden.
  • adtech1.example ist nicht berechtigt, die "Reise und Transportwesen“ Thema für diesen Nutzer, da es auf keiner kürzlich vom Nutzer besuchten Websites vorhanden ist, die diesem Thema zugeordnet sind.
  • adtech2.example hat die Kampagne "Fitness" und „Reise- und Transportwesen“ Themen, aber die "Crafts" .

Der Nutzer hat diy-clothing.example aufgerufen, das die Seite „Mode & Stil“ Topics API, aber es gab keine Aufrufe an die Topics API auf dieser Website. An dieser Stelle bedeutet dies die „Mode & Stil“ -Thema wird von der API für keinen Aufrufer zurückgegeben.

In Woche zwei besucht der Nutzer eine andere Website:

Website Themen API-Aufrufer auf der Website
sewing.example Handwerk adtech2.example

Außerdem wird der Code von „adtech2.example“ zu „diy-clothing.example“ hinzugefügt:

Website Themen API-Aufrufer auf der Website
diy-clothing.example Handwerk, Mode und Stil adtech2.example

Neben „Fitness“ und „Reise- und Transportwesen“ Ab Woche 1 bedeutet dies, dass adtech2.example nun die "Crafts" und „Mode und Stil“ – aber erst in der darauffolgenden Epoche, Woche 3. So wird sichergestellt, dass Dritte nicht mehr über die Vergangenheit eines Nutzers (in diesem Fall sein Interesse an Mode) erfahren können als durch Cookies.

Nach zwei weiteren Wochen und „Reise- und Transportwesen“ kann aus der Liste möglicher Themen von "adtech2.example" verschwinden, wenn der Nutzer keine Websites mit diesen Themen besucht, die Code von "adtech2.example" enthalten.

Nutzersteuerung, Transparenz und Deaktivierung

Nutzer sollten den Zweck der Topics API verstehen, erkennen können, was über sie gesagt wird, wissen, wann die API verwendet wird, und Möglichkeiten haben, sie zu aktivieren oder zu deaktivieren.

Die menschenlesbare Taxonomie der API ermöglicht es Nutzern, mehr über Themen zu erfahren und zu steuern, die ihnen möglicherweise von ihrem Browser vorgeschlagen werden. Nutzer können Themen entfernen, die nicht von der Topics API an Werbetreibende oder Publisher weitergegeben werden sollen. Außerdem gibt es Steuerelemente, mit denen Nutzer über die API informiert und gezeigt werden können, wie sie aktiviert oder deaktiviert werden kann. Informationen und Einstellungen für die Topics API finden Sie unter chrome://settings/adPrivacy. Außerdem sind Themen für API-Aufrufer im Inkognitomodus nicht verfügbar und Themen werden gelöscht, wenn der Browserverlauf gelöscht wird.

Die Liste der zurückgegebenen Themen ist in folgenden Fällen leer:

  • Der Nutzer deaktiviert die Topics API über die Browsereinstellungen unter chrome://settings/adPrivacy.
  • Der Nutzer hat seine Themen (über die Browsereinstellungen unter chrome://settings/adPrivacy) oder seine Cookies gelöscht.
  • Der Browser befindet sich im Inkognitomodus.

Die Erklärung bietet weitere Informationen zu Datenschutzzielen und dazu, wie die API diese Ziele erreichen möchte.

Deaktivierung der Website

Sie können die Topics API auch für Ihre Website oder Seiten auf Ihrer Website deaktivieren. Im Entwicklerleitfaden wird die Vorgehensweise beschrieben.

Topics API auf Websites mit prebid.js verwenden

Wie bereits in der Veröffentlichung von Prebid 7 erwähnt, hat die Community über ein neues Modul aktiv eine Integration mit der Topics API entwickelt. Dieses Modul wurde im Dezember 2022 zusammengeführt.

Weitere Informationen dazu findest du hier:

Nächste Schritte

Reagieren und Feedback geben