本指南說明使用 Google Analytics Data API 產生的報表資料相關重要資訊。使用者經常發現 API (特別是 runReport 方法) 傳回的資料,與 Google Analytics 使用者介面中顯示的資料有出入。
取樣和匯總
Google Analytics Data API runReport 方法可能會傳回樣本資料,特別是針對大型資料集或複雜查詢。Google Analytics 使用者介面也會套用抽樣,但具體門檻和演算法可能有所不同,因此導致記錄的值略有差異。
如要瞭解報表結果是否根據部分可用資料產生,請檢查 ResponseMetaData 物件的 samplingMetadatas 欄位。如果報表結果經過取樣,這個欄位會說明報表使用的事件百分比。
Google Analytics Data API 的某些報表方法可讓您指定所需的取樣層級。您可以使用 properties.reportTasks.create 方法的 samplingLevel 欄位,控管報表的抽樣層級。
這項功能可讓 Google Analytics 360 資源使用高達 10 億筆事件的取樣上限。此外,您也可以將取樣限制設為 UNSAMPLED,針對大量事件使用未取樣的結果。
詳情請參閱「關於資料取樣」。
不重複計數近似值
Google Analytics Data API 會使用 HyperLogLog++ (HLL++) 演算法,估算「活躍使用者」和「工作階段」等指標的不重複計數。API 和 Google Analytics 使用者介面都採用這種做法,可提升效能並有效管理大型資料集,因此結果是近似值,而非確切計數。
如需更多背景資訊,請參閱下列資源: Google Analytics 中的不重複計數估計值 和 使用者人數差異。
資料閾值
Google Analytics 可能會對報表套用資料閾值,避免使用者根據資料中呈現的受眾特徵、興趣或其他信號,推斷個別使用者的身分。
如果報表資料列包含的使用者人數較少,該資料列可能會從結果中排除。如果報表包含高基數維度或自訂維度,就更容易發生這種情況。
如要瞭解這份報表是否受到門檻限制,請檢查 ResponseMetaData 物件的 subjectToThresholding 欄位。
詳情請參閱「資料閾值」。
(other) 列
如果維度的基數高,Google Analytics 可能會將較不常見的值歸類到標示為 (other) 的資料列。如果報表納入的維度每天有超過 500 個不重複值,就更容易發生這種情況。
使用 Data API 篩選器時,請注意篩選器不會查看 (other) 列的內容,且會在資料匯總和產生 (other) 列後套用。
如要瞭解報表是否含有併入 (other) 列的資料,請檢查 ResponseMetaData 物件的 dataLossFromOtherRow 欄位。
詳情請參閱「Google Analytics 4 中的「(其他)」資料列」。
報表識別資訊
報表識別資訊 決定報表如何刪除重複使用者。不同的身分設定 (例如「混合」或「以裝置為準」) 可能會導致相同日期範圍內的使用者人數不同。
Google Analytics 使用者介面和 Data API 都會為資源採用相同的報表識別資訊設定。變更這項設定後,UI 和 API 中的報表都會受到影響。如果在 UI 中執行報表和透過 API 取得報表資料之間變更設定,相同日期範圍的兩份報表可能會有不同的使用者人數。
查詢具體程度
為盡量減少差異,請確保 API 要求中的下列參數與 Google Analytics 使用者介面報表中的設定完全相符:
- 日期範圍:確認開始和結束日期相同。
- 維度和指標:請確認 API 要求中的維度和指標,與 Google Analytics 使用者介面報表中的維度和指標相同。
- 篩選器:請確認 API 要求中套用的任何維度或指標篩選器,都與使用者介面中使用的篩選器相符。
在報表中加入維度,可能會導致計算時使用的事件減少。報表只會納入包含所要求維度資料的事件。因此,在查詢中加入維度可能會改變報表中指標的匯總值。
資料更新間隔
Google Analytics 需要時間處理及彙整事件資料。使用近期資料時,如果資料擷取作業之間有時間延遲,報表可能會出現些微差異。舉例來說,如果您在使用者介面中查看報表,幾分鐘後透過 API 查詢同一份報表,由於系統持續處理及匯總資料,報表中的資料可能已有所變更。
詳情請參閱「資料更新間隔」。
未取樣資料替代方案
如果您的用途需要完整的未取樣事件層級資料,請考慮使用下列替代方案:
BigQuery Export:Google Analytics 的 BigQuery Export
是建議用來對原始事件資料進行進階分析的方法。
Analytics 360:如果資源擁有 Analytics 360 授權,取樣上限會較高,且可使用更詳細的報表功能。