Index
EmbeddedAssistant
(interface)AudioInConfig
(message)AudioInConfig.Encoding
(enum)AudioOut
(message)AudioOutConfig
(message)AudioOutConfig.Encoding
(enum)ConverseConfig
(message)ConverseRequest
(message)ConverseResponse
(message)ConverseResponse.EventType
(enum)ConverseResult
(message)ConverseResult.MicrophoneMode
(enum)ConverseState
(message)
EmbeddedAssistant
Service mettant en œuvre l'API Assistant Google.
Converse | |
---|---|
Lance ou poursuit une conversation avec le service d'assistant intégré. Chaque appel effectue un aller-retour, en envoyant une requête audio au service et en recevant la réponse audio. Utilise le streaming bidirectionnel pour recevoir des résultats, tels que l'événement Une conversation correspond à une ou plusieurs connexions gRPC, chacune composée de plusieurs requêtes et réponses diffusées. Par exemple, il dit Ajouter à ma liste de courses et l'Assistant répond Que voulez-vous ajouter ? La séquence de requêtes et de réponses diffusées dans le premier message gRPC peut se présenter comme suit:
L'utilisateur dit ensuite bagels, et l'assistant répond OK, j'ai ajouté des bagels à votre liste de courses. Il est envoyé via un autre appel de connexion gRPC à la méthode
Bien que l'ordre précis des réponses ne soit pas garanti, les messages ConverseResponse.audio_out séquentiels contiendront toujours des parties audio séquentielles.
|
AudioInConfig
Spécifie comment traiter les données audio_in
qui seront fournies dans les requêtes ultérieures. Pour connaître les paramètres recommandés, consultez les bonnes pratiques concernant l'API gRPC de l'Assistant Google.
Champs | |
---|---|
encoding |
Obligatoire : encodage des données audio envoyées dans tous les messages |
sample_rate_hertz |
Obligatoire : Taux d'échantillonnage (en Hertz) des données audio envoyées dans tous les messages |
Encodage
Encodage audio des données envoyées dans le message audio. L'audio doit être à un seul canal (mono). La seule langue acceptée est "en-US".
Enums | |
---|---|
ENCODING_UNSPECIFIED |
Non spécifié. Renvoie le résultat google.rpc.Code.INVALID_ARGUMENT . |
LINEAR16 |
Échantillons little-endian de 16 bits signés et non compressés (LPCM). Cet encodage n'inclut pas d'en-tête, mais uniquement les octets audio bruts. |
FLAC |
L'encodage FLAC (Free Lossless Audio Codec, codec audio sans perte sans frais) est recommandé, car il est sans perte. De ce fait, la reconnaissance n'est pas compromise et ne nécessite qu'environ la moitié de la bande passante par rapport à LINEAR16 . Cet encodage inclut l'en-tête de flux FLAC suivi des données audio. Il accepte les échantillons 16 bits et 24 bits. Toutefois, tous les champs de STREAMINFO ne sont pas acceptés. |
AudioOut
Audio contenant la réponse de l'assistant à la requête. Des fragments séquentiels de données audio sont reçus dans des messages ConverseResponse
séquentiels.
Champs | |
---|---|
audio_data |
Sortie uniquement : données audio contenant la réponse de l'assistant à la requête. Des fragments séquentiels de données audio sont reçus dans des messages |
AudioOutConfig
Spécifie le format que le serveur doit utiliser lorsqu'il renvoie des messages audio_out
.
Champs | |
---|---|
encoding |
Obligatoire. Encodage des données audio à renvoyer dans tous les messages |
sample_rate_hertz |
Obligatoire. Taux d'échantillonnage en Hertz des données audio renvoyées dans les messages |
volume_percentage |
Obligatoire. Paramètre de volume actuel de la sortie audio de l'appareil. Les valeurs valides sont comprises entre 1 et 100 (correspondant à 1% et 100%). |
Encodage
Encodage audio des données renvoyées dans le message audio. Tous les encodages sont des octets audio bruts sans en-tête, sauf indication contraire ci-dessous.
Enums | |
---|---|
ENCODING_UNSPECIFIED |
Non spécifié. Renvoie le résultat google.rpc.Code.INVALID_ARGUMENT . |
LINEAR16 |
Échantillons little-endian de 16 bits signés et non compressés (LPCM). |
MP3 |
Encodage audio MP3. Le taux d'échantillonnage est encodé dans la charge utile. |
OPUS_IN_OGG |
Audio encodé au format Opus et encapsulé dans un conteneur Ogg. Vous obtiendrez un fichier qui pourra être lu de manière native sur Android et dans certains navigateurs (comme Chrome). La qualité de l'encodage est considérablement supérieure à celle du format MP3 tout en utilisant le même débit. Le taux d'échantillonnage est encodé dans la charge utile. |
ConverseConfig
Indique comment traiter les messages ConverseRequest
.
Champs | |
---|---|
audio_in_config |
Obligatoire Spécifie comment traiter le contenu audio entrant qui suit. |
audio_out_config |
Obligatoire : spécifie le format du contenu audio renvoyé. |
converse_state |
Obligatoire. Représente l'état actuel de la boîte de dialogue. |
ConverseRequest
Message de premier niveau envoyé par le client. Les clients doivent envoyer au moins deux messages ConverseRequest
, et généralement de nombreux. Le premier message doit contenir un message config
et ne doit pas contenir de données audio_in
. Tous les messages suivants doivent contenir des données audio_in
et pas de message config
.
Champs | ||
---|---|---|
Champ d'union converse_request . Un seul de ces champs doit être spécifié dans chaque ConverseRequest . La converse_request ne peut être qu'un des éléments suivants : |
||
config |
Le message |
|
audio_in |
Données audio à reconnaître. Des blocs séquentiels de données audio sont envoyés dans des messages |
ConverseResponse
Message de premier niveau reçu par le client. Une série d'un ou de plusieurs messages ConverseResponse
est diffusée en streaming vers le client.
Champs | ||
---|---|---|
Champ d'union converse_response . Un seul de ces champs sera renseigné dans chaque ConverseResponse . La converse_response ne peut être qu'un des éléments suivants : |
||
error |
Uniquement en sortie Si cette valeur est définie, elle renvoie un message |
|
event_type |
Uniquement en sortie : indique le type d'événement. |
|
audio_out |
Sortie uniquement : contenu audio contenant la réponse de l'assistant à la requête. |
|
result |
Sortie uniquement : résultat sémantique de la requête vocale de l'utilisateur. |
EventType
Indique le type d'événement.
Enums | |
---|---|
EVENT_TYPE_UNSPECIFIED |
Aucun événement spécifié. |
END_OF_UTTERANCE |
Cet événement indique que le serveur a détecté la fin de l'énoncé de l'utilisateur et ne s'attend plus à aucune entrée vocale. Le serveur ne traite donc pas de nouvelles données audio (bien qu'il puisse par la suite renvoyer des résultats supplémentaires). Le client doit arrêter d'envoyer des données audio, interrompre à moitié la connexion gRPC, et attendre les résultats supplémentaires jusqu'à ce que le serveur stoppe cette connexion. |
ConverseResult
Résultat sémantique de la requête vocale de l'utilisateur.
Champs | |
---|---|
spoken_request_text |
Sortie uniquement : transcription reconnue de ce que l'utilisateur a dit. |
spoken_response_text |
Sortie uniquement : texte de la réponse vocale de l'Assistant. Cette valeur n'est renvoyée que pour une action IFTTT. |
conversation_state |
Informations d'état en sortie uniquement pour les |
microphone_mode |
Sortie uniquement Spécifie le mode du micro après le traitement de ce RPC |
volume_percentage |
Sortie uniquement Mise à jour du niveau de volume. La valeur est égale à 0 ou omise (indiquant qu'elle ne change pas), sauf si une commande vocale telle que "Augmenter le volume" ou "Régler le niveau de volume 4" a été reconnue, auquel cas la valeur est comprise entre 1 et 100 (correspondant au nouveau niveau de volume compris entre 1% et 100%). En règle générale, le client doit utiliser ce niveau de volume lors de la lecture des données |
MicrophoneMode
États possibles du micro une fois un RPC Converse
terminé.
Enums | |
---|---|
MICROPHONE_MODE_UNSPECIFIED |
Aucun mode spécifié. |
CLOSE_MICROPHONE |
Le service n'attend pas de question complémentaire de la part de l'utilisateur. Le micro doit rester désactivé jusqu'à ce que l'utilisateur le réactive. |
DIALOG_FOLLOW_ON |
Le service attend une question complémentaire de la part de l'utilisateur. Le micro doit être rouvert à la fin de la lecture du AudioOut (en démarrant un nouvel appel RPC Converse pour envoyer le nouveau contenu audio). |
ConverseState
Fournit des informations sur l'état actuel de la boîte de dialogue.
Champs | |
---|---|
conversation_state |
Obligatoire : valeur |