Ce guide fournit des informations importantes sur les données que vous voyez dans les rapports générés à l'aide de l'API Google Analytics Data. Les utilisateurs constatent souvent des écarts entre les données renvoyées par l'API (en particulier la méthode runReport) et celles affichées dans l'interface utilisateur Google Analytics.
Échantillonnage et agrégation
La méthode runReport de l'API Google Analytics Data peut renvoyer des données échantillonnées, en particulier pour les ensembles de données volumineux ou les requêtes complexes. Bien que l'interface utilisateur Google Analytics applique également l'échantillonnage, les seuils et les algorithmes spécifiques peuvent différer, ce qui entraîne de légères différences dans les valeurs indiquées.
Pour savoir si les résultats du rapport sont basés sur un sous-ensemble des
données disponibles, examinez le
samplingMetadatas
champ de l'objet ResponseMetaData. Si les résultats du rapport sont échantillonnés, ce champ décrit le pourcentage d'événements utilisés dans ce rapport.
Certaines méthodes de reporting de l'API Google Analytics Data vous permettent de spécifier le niveau d'échantillonnage souhaité. Vous pouvez utiliser le
samplingLevel
champ de la properties.reportTasks.create
méthode pour contrôler le niveau d'échantillonnage du rapport.
Cette fonctionnalité permet aux propriétés Google Analytics 360 d'accéder à des limites d'échantillonnage plus élevées (1 milliard d'événements). De plus, les limites d'échantillonnage peuvent être définies sur UNSAMPLED pour utiliser des résultats non échantillonnés pour un grand nombre d'événements.
Pour en savoir plus, consultez À propos de l'échantillonnage des données.
Approximation du nombre unique
L'API Google Analytics Data utilise l'algorithme HyperLogLog++ (HLL++) pour estimer les nombres uniques pour des métriques telles que les utilisateurs actifs et les sessions. Cette approche est utilisée dans l'API et l'interface utilisateur Google Analytics pour améliorer les performances et gérer efficacement les ensembles de données volumineux. Cela signifie que les résultats sont des approximations plutôt que des nombres exacts.
Pour plus de contexte, consultez les ressources suivantes : Approximation du nombre unique dans Google Analytics et Différences dans le nombre d'utilisateurs.
Seuils de données
Google Analytics peut appliquer des seuils de données aux rapports pour empêcher l'identification d'utilisateurs individuels en fonction des données démographiques, des centres d'intérêt ou d'autres signaux présents dans les données.
Si une ligne de rapport contient un petit nombre d'utilisateurs, elle peut être exclue des résultats. Cela est plus courant dans les rapports qui incluent des dimensions à forte cardinalité ou des dimensions personnalisées.
Pour savoir si ce rapport est soumis à des seuils, examinez le
subjectToThresholding
champ de l'objet ResponseMetaData.
Pour en savoir plus, consultez Seuils de données.
Ligne (other)
Si une dimension a une cardinalité élevée, Google Analytics peut regrouper les valeurs moins courantes dans une ligne libellée (other). Cela est plus courant dans les rapports qui incluent des dimensions comportant plus de 500 valeurs uniques par jour.
Lorsque vous utilisez des filtres avec l'API Data, notez qu'ils ne sont pas appliqués à la ligne (other) et qu'ils sont appliqués après l'agrégation des données et la génération de la ligne (other).
Pour savoir si un rapport contient des données regroupées dans la ligne (other),
examinez le
dataLossFromOtherRow
champ de l'objet ResponseMetaData.
Pour en savoir plus, consultez Ligne(other) dans Google Analytics.
Identité pour le reporting
Identité pour le reporting décide comment les utilisateurs sont dédupliqués dans les rapports. Différents paramètres d'identité (tels que "Mixte" ou "Basé sur l'appareil") peuvent entraîner des nombres d'utilisateurs différents pour la même plage de dates.
L'interface utilisateur Google Analytics et l'API Data utilisent le même paramètre d'identité pour le reporting pour votre propriété. Si ce paramètre est modifié, cela affecte les rapports dans l'interface utilisateur et l'API. Si le paramètre est modifié entre l'exécution d'un rapport dans l'interface utilisateur et l'obtention des données du rapport via l'API, le nombre d'utilisateurs peut différer entre les deux rapports pour la même plage de dates.
Spécificité des requêtes
Pour minimiser les écarts, assurez-vous que les paramètres suivants de votre requête API correspondent précisément aux paramètres du rapport de l'interface utilisateur Google Analytics :
- Plages de dates : vérifiez que les dates de début et de fin sont identiques.
- Dimensions et métriques : assurez-vous que les dimensions et les métriques de votre requête API sont identiques à celles du rapport de l'interface utilisateur Google Analytics.
- Filtres : assurez-vous que tous les filtres de dimension ou de métrique appliqués dans la requête API correspondent à ceux utilisés dans l'interface utilisateur.
L'ajout de dimensions à un rapport peut entraîner l'utilisation d'un nombre moins important d'événements dans les calculs. Seuls les événements contenant des données pour les dimensions demandées sont inclus dans un rapport. Par conséquent, l'ajout de dimensions à une requête peut modifier les valeurs agrégées des métriques dans un rapport.
Fraîcheur des données
Google Analytics a besoin de temps pour traiter et agréger les données d'événement. Lorsque vous travaillez avec des données très récentes, vous pouvez constater de légères différences entre les rapports s'il existe un délai entre les récupérations de données. Par exemple, si vous consultez un rapport dans l'interface utilisateur, puis que vous interrogez l'API pour le même rapport quelques minutes plus tard, les données peuvent avoir changé en raison du traitement et de l'agrégation en cours.
Pour en savoir plus, consultez Fraîcheur des données.
Alternatives aux données non échantillonnées
Si votre cas d'utilisation nécessite des données complètes, non échantillonnées et au niveau de l'événement, envisagez d'utiliser les alternatives suivantes :
BigQuery Export : BigQuery Export pour Google Analytics
est la méthode recommandée pour l'analyse avancée des données d'événement brutes.
Analytics 360 : les propriétés disposant d'une licence Analytics 360 ont des limites d'échantillonnage plus élevées et accès à des fonctionnalités de reporting plus détaillées.