Sesle İlgili En İyi Uygulamalar

Bu sayfada, Google Assistant API'ye konuşma verilerinin nasıl sağlanacağıyla ilgili öneriler bulunmaktadır. Bu yönergeler, daha yüksek verimlilik ve doğrulukla birlikte hizmetten makul yanıt süreleri sağlamak için tasarlanmıştır.

Ses ön işleme

İyi kalite ve iyi konumlanmış bir mikrofon kullanarak sesi mümkün olduğunca temiz sağlamak en iyisidir. Ancak, sese gürültü azaltma sinyal işlemesi uygulanması, sesi hizmete göndermeden önce genellikle tanıma doğruluğunu azaltır. Hizmet gürültülü sesleri işleyecek şekilde tasarlanmıştır.

En iyi sonuçlar için:

  • Özellikle arka plan gürültüsü varsa mikrofonu kullanıcıya olabildiğince yakın tutun.
  • Ses kırpmadan kaçının.
  • Otomatik kazanç kontrolü (AGC) kullanmayın.
  • Tüm gürültü azaltma işlemleri devre dışı bırakılmalıdır.

İdeal olarak:

  • Ses düzeyi, giriş sinyalinin kırpılmaması ve en yüksek konuşma ses düzeyleri yaklaşık -20 ila -10 dBFS'ye ulaşacak şekilde kalibre edilmelidir.
  • Cihaz yaklaşık olarak "düz" genlik ve frekans karşılaştırması özelliklerini göstermelidir (+- 3 dB 100 Hz - 8.000 Hz).
  • Toplam harmonik bozulma, 90 dB SPL giriş seviyesinde 100 Hz ile 8.000 Hz arasında% 1'den az olmalıdır.

Örnekleme hızı

Mümkünse ses kaynağının örnekleme hızını 16.000 Hz olarak ayarlayın. Aksi takdirde sample_rate_hertz, yeniden örnekleme yerine ses kaynağının yerel örnek hızıyla eşleşecek şekilde ayarlayın.

Kare boyutu

Google Asistan, mikrofondan yakalanan canlı sesleri tanır. Ses akışı karelere bölünmeli ve ardışık AssistRequest mesajlarıyla gönderilmelidir. Tüm çerçeve boyutları kabul edilir. Büyük kareler daha verimlidir ancak gecikme de artar. Gecikme ile verimlilik arasında iyi bir denge sağlamak için 100 milisaniyelik bir kare boyutu önerilir.