تم إيقاف إجراءات المحادثات نهائيًا في 13 حزيران (يونيو) 2023. لمزيد من المعلومات، يُرجى الاطّلاع على
إنهاء إجراءات المحادثة.
أفضل الممارسات المتعلقة بالمحتوى الصوتي
تنظيم صفحاتك في مجموعات
يمكنك حفظ المحتوى وتصنيفه حسب إعداداتك المفضّلة.
تضم هذه الصفحة اقتراحات حول كيفية توفير بيانات الكلام إلى Google Assistant API. تم تصميم هذه الإرشادات لتحقيق مزيد من الكفاءة والدقة،
بالإضافة إلى أوقات استجابة معقولة من الخدمة.
معالجة الصوت مسبقًا
من الأفضل توفير صوت واضح قدر الإمكان باستخدام ميكروفون ذي جودة جيدة ومكان جيد. ومع ذلك، فإنّ تطبيق معالجة إشارة خفض الضوضاء على الصوت قبل إرساله إلى الخدمة عادةً ما يؤدي إلى تقليل دقة التعرّف. تم تصميم الخدمة لمعالجة الصوت الصاخب.
للحصول على أفضل النتائج:
- ضَع الميكروفون بالقرب من المستخدم قدر الإمكان، لا سيما عند وجود ضوضاء في الخلفية.
- تجنَّب قطع الصوت.
- عدم استخدام ميزة التحكّم التلقائي في الكسب (AGC)
- يجب إيقاف جميع عمليات معالجة تقليل الضوضاء.
من الناحية المثالية:
- ينبغي معايرة مستوى الصوت بحيث لا يتم اقتطاع إشارة الإدخال،
وتصل مستويات الصوت في ذروة الكلام إلى حوالي -20 إلى -10 ديسيبل إف بي.
- من المفترض أن يعرض الجهاز تقريبًا سعات "مسطّحة" مقارنةً بخصائص التردّد الصوتي (+- 3 ديسيبل من 100 هرتز إلى 8000 هرتز).
- يجب أن يكون إجمالي التشوّه التوافقي أقل من% 1 من 100 هرتز إلى 8000 هرتز عند مستوى إدخال SPL يبلغ 90 ديسيبل.
معدّل البيانات في الملف الصوتي
إذا أمكن، اضبط معدّل أخذ العيّنة لمصدر الصوت على 16000 هرتز، وإلا يمكنك
ضبط sample_rate_hertz
بحيث يتطابق مع معدّل العيّنة الأصلي لمصدر الصوت (بدلاً من
إعادة أخذ العيّنات).
حجم الإطار
يتعرّف "مساعد Google" على الصوت المباشر عند تسجيله من ميكروفون.
يجب تقسيم البث الصوتي إلى إطارات وإرساله في رسائل AssistRequest
متتالية. يُسمح باستخدام أي حجم إطار. الإطارات الأكبر أكثر كفاءة
لكنها تضيف وقت استجابة. وننصحك باستخدام حجم إطار يبلغ 100 مللي ثانية كوسيلة
مفاضلة جيدة بين وقت الاستجابة والكفاءة.
إنّ محتوى هذه الصفحة مرخّص بموجب ترخيص Creative Commons Attribution 4.0 ما لم يُنصّ على خلاف ذلك، ونماذج الرموز مرخّصة بموجب ترخيص Apache 2.0. للاطّلاع على التفاصيل، يُرجى مراجعة سياسات موقع Google Developers. إنّ Java هي علامة تجارية مسجَّلة لشركة Oracle و/أو شركائها التابعين.
تاريخ التعديل الأخير: 2023-12-02 (حسب التوقيت العالمي المتفَّق عليه)
[[["يسهُل فهم المحتوى.","easyToUnderstand","thumb-up"],["ساعَدني المحتوى في حلّ مشكلتي.","solvedMyProblem","thumb-up"],["غير ذلك","otherUp","thumb-up"]],[["لا يحتوي على المعلومات التي أحتاج إليها.","missingTheInformationINeed","thumb-down"],["الخطوات معقدة للغاية / كثيرة جدًا.","tooComplicatedTooManySteps","thumb-down"],["المحتوى قديم.","outOfDate","thumb-down"],["ثمة مشكلة في الترجمة.","translationIssue","thumb-down"],["مشكلة في العيّنات / التعليمات البرمجية","samplesCodeIssue","thumb-down"],["غير ذلك","otherDown","thumb-down"]],["تاريخ التعديل الأخير: 2023-12-02 (حسب التوقيت العالمي المتفَّق عليه)"],[[["This page provides recommendations for submitting speech data to the Google Assistant API for optimal performance."],["For best results, use a high-quality microphone, position it close to the user, avoid audio clipping and noise reduction processing, and disable automatic gain control."],["Ideally, calibrate audio levels to prevent clipping, maintain a flat frequency response, and minimize harmonic distortion."],["Set the audio source sampling rate to 16000 Hz if possible, or match the native rate, and use a frame size of around 100 milliseconds for a balance between latency and efficiency."]]],[]]