Batas Kapasitas

Google Ads API bucket meminta pembatasan kapasitas berdasarkan kueri per detik (QPS) per ID pelanggan (CID) klien dan token developer, yang berarti bahwa pengukuran diterapkan secara independen di CID dan token developer. Google Ads API menggunakan algoritma Token Bucket untuk mengukur permintaan dan menentukan batas QPS yang sesuai, sehingga batas tepatnya akan bervariasi bergantung pada beban server secara keseluruhan pada waktu tertentu.

Tujuan penerapan batas kapasitas adalah untuk mencegah satu pengguna mengganggu layanan untuk pengguna lain dengan (baik secara sengaja atau tidak) membebani server Google Ads API dengan volume permintaan yang tinggi.

Permintaan yang melanggar batas kapasitas akan ditolak dengan error: RESOURCE_TEMPORARILY_EXHAUSTED.

Anda dapat mengontrol aplikasi dan mengurangi batas kapasitas dengan secara aktif mengurangi jumlah permintaan dan throttling QPS dari sisi klien.

Ada sejumlah cara untuk mengurangi kemungkinan terlampauinya batas kapasitas. Memahami konsep Pola Integrasi Perusahaan (EIP) seperti Pengiriman Pesan, Pengiriman Ulang, dan Throttling dapat membantu Anda membuat aplikasi klien yang lebih andal.

Praktik yang direkomendasikan berikut diurutkan berdasarkan kompleksitas, dengan strategi yang lebih sederhana di bagian atas, dan arsitektur yang lebih tangguh tetapi canggih setelahnya:

Membatasi tugas serentak

Salah satu penyebab batas kapasitas terlampaui adalah aplikasi klien menimbulkan tugas paralel dalam jumlah yang berlebihan. Meskipun kami tidak membatasi jumlah permintaan paralel yang dapat dimiliki aplikasi klien, jumlah ini dapat dengan mudah melebihi batas Permintaan Per Detik di level token developer.

Sebaiknya tetapkan batas atas yang wajar untuk jumlah total tugas serentak yang akan membuat permintaan (di semua proses dan mesin), serta lakukan penyesuaian ke atas untuk mengoptimalkan throughput tanpa melebihi batas kapasitas.

Selain itu, Anda dapat mempertimbangkan throttling QPS dari sisi klien (lihat Throttling dan pembatas kapasitas).

Permintaan pembuatan batch

Pertimbangkan untuk mengelompokkan beberapa operasi menjadi satu permintaan. Hal ini paling berlaku pada panggilan MutateFoo. Misalnya, jika Anda memperbarui status untuk beberapa instance AdGroupAd - bukan memanggil MutateAdGroupAds satu kali untuk setiap AdGroupAd, Anda dapat memanggil MutateAdGroupAds satu kali, dan meneruskan beberapa operations. Lihat panduan operasi batch kami untuk beberapa contoh tambahan.

Meskipun permintaan batch mengurangi jumlah total permintaan dan mengurangi batas kapasitas Permintaan Per Menit, hal ini dapat memicu batas kapasitas Operasi Per Menit jika Anda melakukan banyak operasi terhadap satu akun.

Throttling dan pembatas kapasitas

Selain membatasi jumlah total thread dalam aplikasi klien, Anda juga dapat mengimplementasikan pembatas kapasitas di sisi klien. Hal ini dapat memastikan semua thread di seluruh proses dan / atau cluster Anda diatur oleh batas QPS tertentu dari sisi klien.

Anda dapat melihat Pembatas Kapasitas Guava, atau menerapkan algoritme berbasis Bucket Token Anda sendiri untuk lingkungan cluster. Misalnya, Anda dapat membuat token dan menyimpannya dalam penyimpanan transaksional bersama seperti database, dan setiap klien harus memperoleh serta menggunakan token sebelum memproses permintaan. Jika token sudah habis digunakan, klien harus menunggu sampai batch token berikutnya dibuat.

Antrean

Antrean pesan adalah solusi untuk distribusi beban operasi, sekaligus mengontrol permintaan dan tarif konsumen. Ada sejumlah opsi antrean pesan yang tersedia—beberapa di antaranya open source, beberapa eksklusif—dan banyak di antaranya yang dapat berfungsi dengan berbagai bahasa.

Saat menggunakan antrean pesan, Anda dapat meminta beberapa produsen yang mengirim pesan ke antrean dan beberapa konsumen memproses pesan tersebut. Throttle dapat diterapkan di sisi konsumen dengan membatasi jumlah konsumen serentak, atau menerapkan pembatas atau throttle kapasitas untuk produsen atau konsumen.

Misalnya, jika konsumen pesan mengalami error batas tarif, konsumen tersebut dapat menampilkan permintaan ke antrean untuk dicoba lagi. Pada saat yang sama, konsumen tersebut juga dapat memberi tahu semua konsumen lainnya untuk menjeda pemrosesan selama beberapa detik untuk memulihkan dari error.