瞭解 CrUX 資料的結構在 BigQuery 中。
引言
BigQuery 是 Google Cloud Platform (GCP) 代管的資料庫,可讓您取得 Chrome 使用者體驗報告 (CrUX) 背後的原始資料。
BigQuery 的 CrUX 可讓使用者直接查詢 2017 年至今的完整資料集,例如分析趨勢、比較網路技術和基準網域。
這些資料是依照每月發布內容建立,並收錄許多摘要表格,方便您輕鬆查詢資料。下文將進一步說明。
BigQuery 資料是以 CrUX 資訊主頁為基礎,因此您不必編寫 SQL 查詢,就能以圖表呈現這項資料。
在 GCP 中存取資料集
使用 BigQuery 需要 GCP 專案,以及 SQL 的基本知識。BigQuery 的 CrUX 資料集免費存取及探索,在免費方案的用量限制內 (每個月會續訂並由 BigQuery 提供)。此外,GCP 的新使用者可能有資格獲得申請抵免額,用來支付超出免費方案配額以外的費用。請注意,GCP 專案必須提供信用卡資訊,請參閱「為什麼需要提供信用卡?」一節。
如果您是第一次使用 BigQuery,請按照下列步驟設定專案:
- 前往 Google Cloud Platform。
- 按一下「Create a Project」(建立專案)。
- 為新專案命名,例如「我的 Chrome 使用者體驗報告」,然後按一下「建立」。
- 在系統提示時輸入帳單資訊。
- 前往 BigQuery 的 CrUX 資料集
現在,您可以開始查詢資料集。
專案機構
BigQuery 的 CrUX 資料會在次月的第二個星期二發布。每個月都會在 chrome-ux-report.all
下發布為新資料表。我們還有許多具體化資料表,提供每個月的摘要統計資料。
- `chrome-ux-report
詳細資料表結構定義
原始資料表
每個國家/地區和 all
資料集的原始資料表都採用以下結構定義:
origin
effective_connection_type
form_factor
first_paint
first_contentful_paint
largest_contentful_paint
dom_content_loaded
onload
first_input
delay
layout_instability
- roll_layout_shift`
interaction_to_next_paint
experimental
permission
notifications
time_to_first_byte
popularity
具體化資料表結構定義
具體化資料表可讓您透過多種鍵維度輕鬆存取摘要資料。不提供直方圖,而是按照效能評估結果和第 75 個百分位數值來匯總成效資料的分數。以下範例顯示 metrics_summary
資料表中的一組範例資料列:
yyyymm | 來源 | fast_lcp | avg_lcp | slow_lcp | p75_lcp |
---|---|---|---|---|---|
202204 | https://example.com | 9.9056 美元 | 0.0635 | 0.0301 | 1600 |
202203 | https://example.com | NT$279 元 | $0.052 美元 | $0.0274 美元 | 1400 |
202202 | https://example.com | $0.9169 美元 | $0.0545 美元 | 0.0284 美元 | 1500 |
202201 | https://example.com | 9072 萬 | 0.0626 | 20298 年 | 1500 |
這表示 202204 年資料集中,在 https://example.com
的實際使用者體驗有 90.56% 符合良好 LCP 的條件,而 LCP 值的第 75 個百分位數為 1,600 毫秒。這比前幾個月慢一點。
提供四種具體化資料表:
metrics_summary
- 依月份和來源顯示重要指標
device_summary
- 依月份、來源和裝置類型顯示重要指標
country_summary
- 依月份、來源、裝置類型和國家/地區顯示重要指標
origin_summary
- 資料集內含的所有來源清單
metrics_summary
metrics_summary
資料表含有每個來源和每個每月資料集的摘要統計資料:
yyyymm
- 資料收集期間月份
origin
- 網站來源的網址
rank
- 粗略熱門程度排名 (截至 2021 年 3 月的資料)
[small|medium|large]_cls
- 流量比例除以 CLS 門檻
[fast|avg|slow]_<metric>
- 按成效門檻區分的流量比例
p75_<metric>
- 成效指標的第 75 個百分位數值 (毫秒)
notification_permission_[accept|deny|ignore|dismiss]
- 通知權限行為的比例
[desktop|phone|tablet]Density
- 依板型規格區分的流量比例
[_4G|_3G|_2G|slow2G|offline]Density
- 依有效連線類型區分的流量百分比
device_summary
「device_summary
」表格內含按月份、來源、國家/地區和裝置劃分的匯總統計資料。除了 metrics_summary
欄以外,還有:
device
- 裝置板型規格
country_summary
「country_summary
」表格內含按月份、來源、國家/地區和裝置劃分的匯總統計資料。除了 metrics_summary
欄以外,還有:
country_code
- 兩個字母的國家/地區代碼
device
- 裝置板型規格
origin_summary
origin_summary
資料表內含 CrUX 資料集的所有來源清單;該資料表每月會以資料集的最新來源清單更新,且有一個資料欄:origin
。
實驗資料集
實驗資料集中的資料表是預設 YYYYMM
資料表的確切副本,但這些資料表使用分區和分群法等較進階的 BigQuery 功能,例如更迅速、更簡單且費用較低的查詢。
country
experimental.country
資料集包含 country_CC
資料集的匯總資料,以及資料集日期的額外 yyyymm
資料欄。結構定義與原始資料表相同,但會新增日期和 country_code
資料欄,因此可在不彙整每月資料表的情況下,執行國家/地區層級的查詢以不同方式執行比較。
global
experimental.global
資料集包含 all
資料集的匯總資料,以及資料集日期的額外 yyyymm
資料欄。結構定義與新增日期的原始資料表相同,可在不彙整每月資料表的情況下比較不同查詢的資料。