يوضّح هذا الدليل معلومات مهمة عن البيانات التي تظهر في التقارير التي يتم إنشاؤها باستخدام Google Analytics Data API. كثيرًا ما يواجه المستخدِمون اختلافات بين البيانات التي تعرضها واجهة برمجة التطبيقات (وتحديدًا طريقة runReport) والبيانات المعروضة في واجهة مستخدِم "إحصاءات Google".
تحليل عيّنات البيانات وتجميعها
يمكن أن تعرض طريقة runReport في Google Analytics Data API بيانات مستندة إلى عيّنات، لا سيّما لمجموعات البيانات الكبيرة أو طلبات البحث المعقّدة. على الرغم من أنّ واجهة مستخدِم "إحصاءات Google" تطبّق أيضًا تحليل عيّنات البيانات، يمكن أن تختلف الحدود الدنيا والخوارزميات المحدّدة، ما يؤدّي إلى اختلافات طفيفة في القيم المعروضة.
لمعرفة ما إذا كانت نتائج التقرير تستند إلى مجموعة فرعية من
البيانات المتاحة، اطّلِع على
samplingMetadatas
حقل العنصر ResponseMetaData. إذا كانت نتائج التقرير مستندة إلى عيّنات، يوضّح هذا الحقل النسبة المئوية للأحداث المستخدَمة في هذا التقرير.
تتيح لك بعض طرق إعداد التقارير في Google Analytics Data API تحديد مستوى تحليل عيّنات البيانات الذي تريده. يمكنك استخدام الـ
samplingLevel
حقل في طريقة properties.reportTasks.create
للتحكّم في مستوى تحليل عيّنات البيانات في التقرير.
تمنح هذه الميزة مواقع "إحصاءات Google 360" إمكانية الوصول إلى حدود أعلى لتحليل عيّنات البيانات تبلغ مليار حدث. يمكن أيضًا ضبط حدود تحليل عيّنات البيانات على UNSAMPLED لاستخدام النتائج غير المستندة إلى عيّنات لأعداد الأحداث الكبيرة.
لمزيد من المعلومات، اطّلِع على مقالة لمحة عن تحليل عيّنات البيانات.
تقريب الأعداد الفريدة
تستخدِم Google Analytics Data API خوارزمية HyperLogLog++ (اختصارًا HLL++) لتقدير الأعداد الفريدة لمقاييس مثل "المستخدِمون النشطون" و"الجلسات". يتم استخدام هذا النهج في واجهة برمجة التطبيقات وواجهة مستخدِم "إحصاءات Google" لتحسين الأداء وإدارة مجموعات البيانات الكبيرة بكفاءة، ما يعني أنّ النتائج هي تقديرات وليست أعدادًا دقيقة.
لمزيد من السياق، يُرجى الرجوع إلى المَرجعين التاليَين: تقريب الأعداد الفريدة في "إحصاءات Google" و الاختلافات في أعداد المستخدِمين.
حدود البيانات
قد تطبّق "إحصاءات Google" حدودًا للبيانات في التقارير لمنع تحديد هوية المستخدِمين الفرديين استنادًا إلى الخصائص الديمغرافية أو الاهتمامات أو الإشارات الأخرى المتوفّرة في البيانات.
إذا كان صف التقرير يحتوي على عدد صغير من المستخدِمين، قد يتم استبعاد هذا الصف من النتائج. ويحدث ذلك بشكلٍ أكبر في التقارير التي تتضمّن سمات تتضمّن عددًا كبيرًا من القيم أو سمات مخصّصة.
لمعرفة ما إذا كان هذا التقرير يخضع لحدود البيانات، اطّلِع على
subjectToThresholding
حقل في عنصر ResponseMetaData.
لمزيد من المعلومات، اطّلِع على مقالة حدود البيانات.
صف (other)
إذا كانت إحدى السمات تتضمّن عددًا كبيرًا من القيم، قد تجمع "إحصاءات Google" القيم الأقل شيوعًا في صف يحمل التصنيف (other). ويحدث ذلك بشكلٍ أكبر في التقارير التي تتضمّن سمات تحتوي على أكثر من 500 قيمة فريدة في اليوم.
عند استخدام الفلاتر مع Data API، يُرجى العِلم أنّ الفلاتر لا تبحث داخل صف (other)، ويتم تطبيقها بعد تجميع البيانات وإنشاء صف (other).
لمعرفة ما إذا كان التقرير يحتوي على بيانات تم تجميعها في صف (other)، اطّلِع على dataLossFromOtherRowحقل في عنصر ResponseMetaData.
لمزيد من المعلومات، اطّلِع على مقالة صف (other) في "إحصاءات Google".
المعلومات التعريفية في التقارير
تحدّد المعلومات التعريفية في التقارير كيفية إزالة تكرار المستخدِمين في التقارير. يمكن أن تؤدّي إعدادات المعلومات التعريفية المختلفة (مثل "مختلطة" أو "مستندة إلى الجهاز") إلى أعداد مختلفة للمستخدِمين للنطاق الزمني نفسه.
تستخدِم كلّ من واجهة مستخدِم "إحصاءات Google" وData API إعداد المعلومات التعريفية في التقارير نفسه لموقعك. إذا تم تغيير هذا الإعداد، سيؤثّر ذلك في التقارير في كلّ من واجهة المستخدِم وواجهة برمجة التطبيقات. إذا تم تغيير الإعداد بين تشغيل تقرير في واجهة المستخدِم والحصول على بيانات التقرير من خلال واجهة برمجة التطبيقات، قد تختلف أعداد المستخدِمين بين التقريرَين للنطاق الزمني نفسه.
مدى تحديد طلب البحث
للحدّ من التناقضات، تأكَّد من أنّ المَعلمات التالية في طلب واجهة برمجة التطبيقات تتطابق تمامًا مع الإعدادات في تقرير واجهة مستخدِم "إحصاءات Google":
- النطاقات الزمنية: تأكَّد من أنّ تاريخَي البدء والانتهاء متطابقان.
- المكوّنات والمقاييس: تأكَّد من أنّ المكوّنات والمقاييس في طلب واجهة برمجة التطبيقات هي نفسها المكوّنات والمقاييس في تقرير واجهة مستخدِم "إحصاءات Google" .
- الفلاتر: تأكَّد من أنّ أي فلاتر للسمات أو المقاييس يتم تطبيقها في طلب بيانات من واجهة برمجة التطبيقات تتطابق مع الفلاتر المستخدَمة في واجهة المستخدِم.
يمكن أن تؤدّي إضافة المكوّنات إلى تقرير إلى استخدام عدد أقل من الأحداث في العمليات الحسابية. لا يتم تضمين سوى الأحداث التي تحتوي على بيانات للمكوّنات المطلوبة في التقرير. نتيجةً لذلك، يمكن أن يؤدّي إضافة المكوّنات إلى طلب بحث إلى تغيير القيم المجمّعة للمقاييس في التقرير.
سرعة توفُّر البيانات
تستغرِق "إحصاءات Google" وقتًا لمعالجة بيانات الأحداث وتجميعها. عند استخدام بيانات حديثة جدًا، قد تلاحظ اختلافات طفيفة بين التقارير إذا كان هناك تأخير زمني بين عمليات استرداد البيانات. على سبيل المثال، إذا اطّلعت على تقرير في واجهة المستخدِم ثم طلبت من واجهة برمجة التطبيقات الحصول على التقرير نفسه بعد دقائق، قد تكون البيانات قد تغيّرت بسبب المعالجة والتجميع المستمرّين.
لمزيد من المعلومات، اطّلِع على مقالة حداثة البيانات.
بدائل البيانات غير المستندة إلى عيّنات
إذا كانت حالة الاستخدام تتطلّب بيانات كاملة وغير مستندة إلى عيّنات على مستوى الحدث، ننصحك باستخدام البدائل التالية:
BigQuery Export: ميزة BigQuery Export لخدمة "إحصاءات Google"
هي الطريقة المقترَحة لإجراء تحليل متقدّم لبيانات الأحداث الأولية.
إحصاءات 360: تتضمّن المواقع التي لديها ترخيص "إحصاءات 360" حدودًا أعلى لأخذ العينات وتتيح الوصول إلى ميزات إعداد تقارير أكثر تفصيلاً.