BigQuery 的 CrUX

瞭解 CrUX 資料的結構在 BigQuery 中。

引言

BigQuery 是 Google Cloud Platform (GCP) 代管的資料庫,可讓您取得 Chrome 使用者體驗報告 (CrUX) 背後的原始資料。

BigQuery 的 CrUX 可讓使用者直接查詢 2017 年至今的完整資料集,例如分析趨勢、比較網路技術和基準網域。

這些資料是依照每月發布內容建立,並收錄許多摘要表格,方便您輕鬆查詢資料。下文將進一步說明。

BigQuery 資料是以 CrUX 資訊主頁為基礎,因此您不必編寫 SQL 查詢,就能以圖表呈現這項資料。

在 GCP 中存取資料集

使用 BigQuery 需要 GCP 專案,以及 SQL 的基本知識。BigQuery 的 CrUX 資料集免費存取及探索,在免費方案的用量限制內 (每個月會續訂並由 BigQuery 提供)。此外,GCP 的新使用者可能有資格獲得申請抵免額,用來支付超出免費方案配額以外的費用。請注意,GCP 專案必須提供信用卡資訊,請參閱「為什麼需要提供信用卡?」一節。

如果您是第一次使用 BigQuery,請按照下列步驟設定專案:

  1. 前往 Google Cloud Platform
  2. 按一下「Create a Project」(建立專案)
  3. 為新專案命名,例如「我的 Chrome 使用者體驗報告」,然後按一下「建立」。
  4. 在系統提示時輸入帳單資訊。
  5. 前往 BigQuery 的 CrUX 資料集

現在,您可以開始查詢資料集。

專案機構

BigQuery 的 CrUX 資料會在次月的第二個星期二發布。每個月都會在 chrome-ux-report.all 下發布為新資料表。我們還有許多具體化資料表,提供每個月的摘要統計資料。

詳細資料表結構定義

原始資料表

每個國家/地區和 all 資料集的原始資料表都採用以下結構定義:

  • origin
  • effective_connection_type
  • form_factor
  • first_paint
  • first_contentful_paint
  • largest_contentful_paint
  • dom_content_loaded
  • onload
  • first_input
    • delay
  • layout_instability
    • roll_layout_shift`
  • interaction_to_next_paint
  • experimental
    • permission
      • notifications
    • time_to_first_byte
    • popularity

具體化資料表結構定義

具體化資料表可讓您透過多種鍵維度輕鬆存取摘要資料。不提供直方圖,而是按照效能評估結果和第 75 個百分位數值來匯總成效資料的分數。以下範例顯示 metrics_summary 資料表中的一組範例資料列:

yyyymm 來源 fast_lcp avg_lcp slow_lcp p75_lcp
202204 https://example.com 9.9056 美元 0.0635 0.0301 1600
202203 https://example.com NT$279 元 $0.052 美元 $0.0274 美元 1400
202202 https://example.com $0.9169 美元 $0.0545 美元 0.0284 美元 1500
202201 https://example.com 9072 萬 0.0626 20298 年 1500

這表示 202204 年資料集中,在 https://example.com 的實際使用者體驗有 90.56% 符合良好 LCP 的條件,而 LCP 值的第 75 個百分位數為 1,600 毫秒。這比前幾個月慢一點。

提供四種具體化資料表:

metrics_summary
依月份和來源顯示重要指標
device_summary
依月份、來源和裝置類型顯示重要指標
country_summary
依月份、來源、裝置類型和國家/地區顯示重要指標
origin_summary
資料集內含的所有來源清單

metrics_summary

metrics_summary 資料表含有每個來源和每個每月資料集的摘要統計資料:

yyyymm
資料收集期間月份
origin
網站來源的網址
rank
粗略熱門程度排名 (截至 2021 年 3 月的資料)
[small|medium|large]_cls
流量比例除以 CLS 門檻
[fast|avg|slow]_<metric>
按成效門檻區分的流量比例
p75_<metric>
成效指標的第 75 個百分位數值 (毫秒)
notification_permission_[accept|deny|ignore|dismiss]
通知權限行為的比例
[desktop|phone|tablet]Density
依板型規格區分的流量比例
[_4G|_3G|_2G|slow2G|offline]Density
依有效連線類型區分的流量百分比

device_summary

device_summary」表格內含按月份、來源、國家/地區和裝置劃分的匯總統計資料。除了 metrics_summary 欄以外,還有:

device
裝置板型規格

country_summary

country_summary」表格內含按月份、來源、國家/地區和裝置劃分的匯總統計資料。除了 metrics_summary 欄以外,還有:

country_code
兩個字母的國家/地區代碼
device
裝置板型規格

origin_summary

origin_summary 資料表內含 CrUX 資料集的所有來源清單;該資料表每月會以資料集的最新來源清單更新,且有一個資料欄:origin

實驗資料集

實驗資料集中的資料表是預設 YYYYMM 資料表的確切副本,但這些資料表使用分區分群法等較進階的 BigQuery 功能,例如更迅速、更簡單且費用較低的查詢。

country

experimental.country 資料集包含 country_CC 資料集的匯總資料,以及資料集日期的額外 yyyymm 資料欄。結構定義與原始資料表相同,但會新增日期和 country_code 資料欄,因此可在不彙整每月資料表的情況下,執行國家/地區層級的查詢以不同方式執行比較。

global

experimental.global 資料集包含 all 資料集的匯總資料,以及資料集日期的額外 yyyymm 資料欄。結構定義與新增日期的原始資料表相同,可在不彙整每月資料表的情況下比較不同查詢的資料。