CrUX على BigQuery

تعرَّف على كيفية تنظيم بيانات CrUX في BigQuery.

مقدمة

تتوفّر البيانات الأولية لتقرير تجربة المستخدم من Chrome (CrUX) على BigQuery، وهي قاعدة بيانات مستضافة على Google Cloud Platform (GCP).

تسمح أداة CrUX على BigQuery للمستخدمين بإجراء طلبات بحث مباشرة في مجموعة البيانات الكاملة التي تعود إلى عام 2017، على سبيل المثال، لتحليل المؤشرات ومقارنة تقنيات الويب ونطاقات قياس الأداء.

يتم تنظيم البيانات حسب الإصدار الشهري، فضلاً عن عدد من جداول الملخص لتوفير وصول بسيط للاستعلام عن البيانات. وفي ما يلي المزيد من توثيقها.

بيانات BigQuery هي أساس لوحة بيانات CrUX، والتي تسمح لك بعرض هذه البيانات بدون كتابة طلبات بحث SQL.

الوصول إلى مجموعة البيانات في Google Cloud Platform

يتطلب استخدام BigQuery وجود مشروع Google Cloud Platform ومعرفة أساسية بـ SQL. يمكن الوصول إلى مجموعة بيانات CrUX في BigQuery مجانًا واستكشافها حتى حدود المستوى المجاني، والتي يتم تجديدها شهريًا وتوفيرها من خلال BigQuery. بالإضافة إلى ذلك، قد يكون مستخدمو GCP الجدد مؤهَّلين للحصول على رصيد اشتراك لتغطية النفقات خارج المستوى المجاني. ملاحظة: يجب تقديم بطاقة ائتمان لمشروع Google Cloud Platform، يُرجى الاطّلاع على المقالة لماذا يجب تقديم بطاقة ائتمان؟.

إذا كانت هذه هي المرة الأولى التي تستخدم فيها BigQuery، فاتبع الخطوات التالية لإعداد مشروع:

  1. انتقِل إلى Google Cloud Platform.
  2. انقر على إنشاء مشروع.
  3. امنح مشروعك الجديد اسمًا مثل "تقرير تجربة المستخدم في Chrome" وانقر على "إنشاء".
  4. أدخِل معلومات الفوترة إذا طُلب منك ذلك.
  5. انتقِل إلى مجموعة بيانات CrUX في BigQuery.

أنت الآن جاهز لبدء الاستعلام عن مجموعة البيانات.

تنظيم المشروع

يتم إصدار بيانات CrUX في BigQuery في يوم الثلاثاء الثاني من الشهر التالي. يتم عرض بيانات كل شهر كجدول جديد ضمن chrome-ux-report.all. يتوفر أيضًا عدد من الجداول المزخرفة التي توفر إحصاءات موجزة لكل شهر.

مخطط جدول تفصيلي

الجداول الأولية

تتضمّن الجداول الأوليّة لكل بلد ومجموعة بيانات all المخطط التالي:

  • origin
  • effective_connection_type
  • form_factor
  • first_paint
  • first_contentful_paint
  • largest_contentful_paint
  • dom_content_loaded
  • onload
  • first_input
    • delay
  • layout_instability
    • تراكم_تنسيق_shift`
  • interaction_to_next_paint
  • experimental
    • permission
      • notifications
    • time_to_first_byte
    • popularity

مخطط جدول مجسَّم

تتوفر الجداول الشاملة لتسهيل الوصول إلى البيانات الموجزة حسب عدد من الأبعاد الأساسية. ولا يتم توفير مدرجات تكرارية، وبدلاً من ذلك يتم تجميع بيانات الأداء إلى كسور حسب تقييم الأداء والقيمة المئوية الخامسة والسبعين. في ما يلي مجموعة من نماذج الصفوف من جدول metrics_summary كمثال:

yyyymm الأصل fast_lcp avg_lcp slow_lcp p75_lcp
202204 https://example.com 0.9056 0.0635 0.0301 1,600
202203 https://example.com 0.9209 0,052 0.0274 1,400
202202 https://example.com 0.9169 0.0545 0.0284 1500
202201 https://example.com 0.9072 0.0626 0.0298 1500

يوضِّح ذلك أنّه في مجموعة بيانات 202204، استوفت 90.56% من تجارب المستخدمين الفعليين على https://example.com معايير سرعة عرض أكبر جزء من المحتوى على الصفحة (LCP)، وأنّ القيمة التقريبية لمقياس LCP كانت 1,600 ملي ثانية. وتيرة ذلك مقارنةً بالأشهر السابقة.

تتوفر أربعة جداول مكونة:

metrics_summary
المقاييس الرئيسية حسب الشهر والمنشأ
device_summary
المقاييس الرئيسية حسب الشهر والمصدر ونوع الجهاز
country_summary
المقاييس الرئيسية حسب الشهر والمصدر ونوع الجهاز والبلد
origin_summary
قائمة بجميع الأصول المضمّنة في مجموعة البيانات

metrics_summary

يتضمّن الجدول metrics_summary إحصاءات ملخّصة لكل مصدر وكل مجموعة بيانات شهرية:

yyyymm
شهر فترة جمع البيانات
origin
عنوان URL لأصل الموقع الإلكتروني
rank
ترتيب تقريبي لرواج (اعتبارًا من آذار (مارس) 2021)
[small|medium|large]_cls
نسبة الزيارات حسب حدود CLS
[fast|avg|slow]_<metric>
نسبة الزيارات حسب الحدود الدنيا للأداء
p75_<metric>
القيمة المئوية الخامسة والسبعين لمقاييس الأداء (بالمللي ثانية)
notification_permission_[accept|deny|ignore|dismiss]
جزء من سلوكيات أذونات الإشعارات
[desktop|phone|tablet]Density
نسبة الزيارات حسب شكل الجهاز
[_4G|_3G|_2G|slow2G|offline]Density
نسبة الزيارات حسب نوع الاتصال الفعّال

device_summary

يحتوي الجدول "device_summary" على إحصاءات مجمّعة حسب الشهر وبلد المصدر والبلد والجهاز. بالإضافة إلى أعمدة "metrics_summary"، هناك ما يلي:

device
عامل شكل الجهاز

country_summary

يحتوي الجدول "country_summary" على إحصاءات مجمّعة حسب الشهر وبلد المصدر والبلد والجهاز. بالإضافة إلى أعمدة "metrics_summary"، هناك ما يلي:

country_code
رمز البلد المكوّن من حرفين
device
عامل شكل الجهاز

origin_summary

يحتوي جدول origin_summary على قائمة بجميع الأصول في مجموعة بيانات CrUX، ويتم تعديله شهريًا باستخدام أحدث قائمة بالأصول في مجموعة البيانات ويحتوي على عمود واحد: origin.

مجموعة البيانات التجريبية

الجداول في مجموعة البيانات التجريبية هي نُسخ تامة من جداول YYYYMM التلقائية، ولكنها تستخدم ميزات BigQuery الأحدث والأكثر تقدّمًا، مثل التقسيم والتجميع، والتي تتيح لك كتابة طلبات بحث أسرع وأبسط وأقل تكلفة.

country

تحتوي مجموعة بيانات experimental.country على بيانات مجمّعة من مجموعات بيانات country_CC مع عمود yyyymm إضافي لتاريخ مجموعة البيانات. يتطابق هذا المخطط مع الجداول الأولية مع إضافة أعمدة التاريخ وcountry_code، ما يسمح بإجراء مقارنة على مستوى البلد عبر طلبات البحث الزمنية بدون الانضمام إلى الجداول الشهرية.

global

تحتوي مجموعة البيانات experimental.global على بيانات مجمّعة من مجموعة البيانات all مع عمود yyyymm إضافي لتاريخ مجموعة البيانات. يتطابق المخطط مع الجداول الأولية مع إضافة التاريخ، ما يسمح بالمقارنة مع طلبات البحث الزمنية التي يتم تنفيذها بدون الانضمام إلى الجداول الشهرية.