Batas Kapasitas

Google Ads API mengelompokkan permintaan untuk pembatasan kapasitas berdasarkan kueri per detik (QPS) per ID pelanggan (CID) klien dan token developer, yang berarti pengukuran diterapkan secara independen pada CID dan token developer. Google Ads API menggunakan algoritma Token Bucket untuk mengukur permintaan dan menentukan batas QPS yang sesuai, sehingga batas pastinya akan bervariasi bergantung pada beban server keseluruhan pada waktu tertentu.

Tujuan penerapan batas kapasitas adalah untuk mencegah satu pengguna mengganggu layanan bagi pengguna lain dengan (sengaja atau tidak sengaja) melebihi kapasitas server Google Ads API dengan volume permintaan yang tinggi.

Permintaan yang melanggar batas kapasitas akan ditolak dengan error: RESOURCE_TEMPORARILY_EXHAUSTED.

Anda dapat mengontrol aplikasi dan mengurangi batas kapasitas dengan secara aktif mengurangi jumlah permintaan dan membatasi QPS dari sisi klien.

Ada beberapa cara untuk mengurangi kemungkinan terlampauinya batas kapasitas. Memahami konsep Enterprise Integration Patterns (EIP) seperti Messaging, Redelivery, dan Throttling dapat membantu Anda membuat aplikasi klien yang lebih andal.

Praktik yang direkomendasikan berikut diurutkan berdasarkan kompleksitas, dengan strategi yang lebih sederhana di bagian atas dan arsitektur yang lebih andal tetapi canggih setelahnya:

Membatasi tugas serentak

Salah satu akar penyebab melampaui batas kapasitas adalah aplikasi klien menghasilkan jumlah tugas paralel yang berlebihan. Meskipun kami tidak membatasi jumlah permintaan paralel yang dapat dimiliki aplikasi klien, hal ini dapat dengan mudah melampaui batas Permintaan Per Detik di tingkat token developer.

Sebaiknya tetapkan batas atas yang wajar untuk jumlah total tugas serentak yang akan membuat permintaan (di semua proses dan mesin), dan sesuaikan ke atas untuk mengoptimalkan throughput tanpa melebihi batas kapasitas.

Selain itu, Anda dapat mempertimbangkan throttling QPS dari sisi klien (lihat Throttling dan pembatasan kapasitas).

Permintaan pembuatan batch

Pertimbangkan untuk mengelompokkan beberapa operasi ke dalam satu permintaan. Hal ini paling berlaku pada panggilan MutateFoo. Misalnya, jika Anda memperbarui status untuk beberapa instance AdGroupAd, Anda dapat memanggil MutateAdGroupAds satu kali, dan meneruskan beberapa operations, bukan memanggil MutateAdGroupAds satu kali untuk setiap AdGroupAd. Lihat panduan operasi batch kami untuk beberapa contoh tambahan.

Meskipun permintaan batch mengurangi jumlah total permintaan dan mengurangi batas kapasitas Permintaan Per Menit, tindakan ini dapat memicu batas kapasitas Operasi Per Menit jika Anda melakukan operasi dalam jumlah besar terhadap satu akun.

Throttling dan pembatas kapasitas

Selain membatasi jumlah total thread di aplikasi klien, Anda juga dapat menerapkan pembatasan kapasitas di sisi klien. Hal ini dapat memastikan semua thread di seluruh proses dan / atau cluster Anda diatur oleh batas QPS tertentu dari sisi klien.

Anda dapat melihat Pembatas Kapasitas Guava, atau menerapkan algoritma berbasis Token Bucket Anda sendiri untuk lingkungan cluster. Misalnya, Anda dapat membuat token dan menyimpannya di penyimpanan transaksional bersama seperti database, dan setiap klien harus memperoleh dan menggunakan token sebelum memproses permintaan. Jika token sudah habis, klien harus menunggu hingga batch token berikutnya dibuat.

Antrean

Antrean pesan adalah solusi untuk distribusi beban operasi, sekaligus mengontrol permintaan dan kecepatan konsumen. Ada sejumlah opsi antrean pesan yang tersedia—beberapa open source, beberapa eksklusif—dan banyak di antaranya dapat digunakan dengan bahasa yang berbeda.

Saat menggunakan antrean pesan, Anda dapat memiliki beberapa produsen yang mengirim pesan ke antrean dan beberapa konsumen yang memproses pesan tersebut. Throttling dapat diterapkan di sisi konsumen dengan membatasi jumlah konsumen serentak, atau menerapkan pembatas kapasitas atau throttler untuk produsen atau konsumen.

Misalnya, jika konsumen pesan mengalami error batas kapasitas, konsumen tersebut dapat menampilkan permintaan ke antrean untuk dicoba lagi. Pada saat yang sama, konsumen tersebut juga dapat memberi tahu semua konsumen lain untuk menjeda pemrosesan selama beberapa detik untuk memulihkan dari error.