Índice
- EmbeddedAssistant(interface)
- AudioInConfig(mensagem)
- AudioInConfig.Encoding(enum)
- AudioOut(mensagem)
- AudioOutConfig(mensagem)
- AudioOutConfig.Encoding(enum)
- ConverseConfig(mensagem)
- ConverseRequest(mensagem)
- ConverseResponse(mensagem)
- ConverseResponse.EventType(enum)
- ConverseResult(mensagem)
- ConverseResult.MicrophoneMode(enum)
- ConverseState(mensagem)
EmbeddedAssistant
Serviço que implementa a API Google Assistant.
| Converse | |
|---|---|
| 
 Inicia ou continua uma conversa com o serviço de assistente incorporado. Cada chamada realiza uma viagem de ida e volta, enviando uma solicitação de áudio ao serviço e recebendo a resposta de áudio. Usa streaming bidirecional para receber resultados, como o evento  Uma conversa é uma ou mais conexões gRPC, cada uma consistindo em várias solicitações e respostas transmitidas. Por exemplo, o usuário diz Adicionar à minha lista de compras e o assistente responde O que você quer adicionar?. A sequência das solicitações e respostas transmitidas na primeira mensagem gRPC pode ser: 
 O usuário diz bagels e o assistente responde Ok, adicionei bagels à sua lista de compras. Isso é enviado como outra chamada de conexão gRPC para o método  
 Ainda que a ordem exata das respostas não seja garantida, as mensagens sequenciais ConverseResponse.audio_out sempre vão ter partes sequenciais de áudio. 
 | |
AudioInConfig
Especifica como processar os dados do audio_in que serão fornecidos nas próximas solicitações. Para conferir as configurações recomendadas, consulte as práticas recomendadas da API gRPC do Google Assistente.
| Campos | |
|---|---|
| encoding | 
                    Obrigatório Codificação de dados de áudio enviados em todas as mensagens  | 
| sample_rate_hertz | 
 
                    Obrigatório Taxa de amostragem (em Hertz) dos dados de áudio enviados em todas as mensagens  | 
Codificação
Codificação de áudio dos dados enviados na mensagem de áudio. O áudio precisa ser de um canal (mono). O único idioma compatível é "en-US".
| Enums | |
|---|---|
| ENCODING_UNSPECIFIED | Não especificado. Retorna o resultado google.rpc.Code.INVALID_ARGUMENT. | 
| LINEAR16 | Amostras pouco elaboradas de 16 bits sem compactação (PCM Linear). Essa codificação não inclui cabeçalho, somente os bytes brutos de áudio. | 
| FLAC | FLAC(Free Lossless Audio Codec) é a codificação recomendada porque não tem perdas. Portanto, o reconhecimento não é comprometido e requer apenas cerca de metade da largura de banda doLINEAR16. Essa codificação inclui o cabeçalho de streamFLACseguido pelos dados de áudio. Ele oferece suporte a amostras de 16 e 24 bits, mas nem todos os campos emSTREAMINFOsão compatíveis. | 
AudioOut
O áudio que contém a resposta do assistente à consulta. Os blocos sequenciais de dados de áudio são recebidos em mensagens ConverseResponse sequenciais.
| Campos | |
|---|---|
| audio_data | 
 
                    Somente saída: os dados de áudio que contêm a resposta do assistente à consulta. Os blocos sequenciais de dados de áudio são recebidos em mensagens  | 
AudioOutConfig
Especifica o formato desejado que o servidor usará quando retornar mensagens audio_out.
| Campos | |
|---|---|
| encoding | 
                    Obrigatório A codificação dos dados de áudio a ser retornada em todas as mensagens  | 
| sample_rate_hertz | 
 
                    Obrigatório A taxa de amostragem em Hertz dos dados de áudio retornados em mensagens  | 
| volume_percentage | 
 Obrigatório Configuração de volume atual da saída de áudio do dispositivo. Os valores válidos são de 1 a 100 (correspondente a 1% a 100%). | 
Codificação
Codificação dos dados retornados na mensagem de áudio. Todas as codificações são bytes de áudio brutos sem cabeçalho, exceto conforme indicado abaixo.
| Enums | |
|---|---|
| ENCODING_UNSPECIFIED | Não especificado. Retorna o resultado google.rpc.Code.INVALID_ARGUMENT. | 
| LINEAR16 | Amostras pouco elaboradas de 16 bits sem compactação (PCM Linear). | 
| MP3 | Codificação de áudio MP3. A taxa de amostragem é codificada no payload. | 
| OPUS_IN_OGG | Áudio codificado em Opus unido em um contêiner ogg. O resultado será um arquivo que pode ser reproduzido de forma nativa no Android e em alguns navegadores, como o Chrome. A qualidade da codificação é consideravelmente maior do que a do MP3 e usa a mesma taxa de bits. A taxa de amostragem é codificada no payload. | 
ConverseConfig
Especifica como processar as mensagens ConverseRequest.
| Campos | |
|---|---|
| audio_in_config | Obrigatório Especifica como processar o áudio de entrada subsequente. | 
| audio_out_config | Obrigatório Especifica como formatar o áudio que será retornado. | 
| converse_state | Obrigatório representa o estado atual da caixa de diálogo. | 
ConverseRequest
A mensagem de nível superior enviada pelo cliente. Os clientes precisam enviar pelo menos duas e, normalmente, várias mensagens ConverseRequest. A primeira mensagem precisa conter uma mensagem config e não pode conter dados audio_in. Todas as mensagens subsequentes precisam conter dados audio_in e não podem conter uma mensagem config.
| Campos | ||
|---|---|---|
| Campo de união converse_request. Exatamente um desses campos precisa ser especificado em cadaConverseRequest.converse_requestpode ser apenas de um dos tipos a seguir: | ||
| config | 
                    A mensagem  | |
| audio_in | 
 
                    Dados de áudio a serem reconhecidos. Os blocos sequenciais de dados de áudio são enviados em mensagens  | |
ConverseResponse
A mensagem de nível superior recebida pelo cliente. É feito streaming de uma ou mais mensagens ConverseResponse de volta para o cliente.
| Campos | ||
|---|---|---|
| Campo de união converse_response. Exatamente um desses campos será preenchido em cadaConverseResponse.converse_responsepode ser apenas de um dos tipos a seguir: | ||
| error | 
                    Somente saída: se definido, retorna uma mensagem  | |
| event_type | Somente saída Indica o tipo de evento. | |
| audio_out | Somente saída: o áudio que contém a resposta do assistente à consulta. | |
| result | Somente saída O resultado semântico para a consulta falada do usuário. | |
EventType
Indica o tipo de evento.
| Enums | |
|---|---|
| EVENT_TYPE_UNSPECIFIED | Nenhum evento especificado. | 
| END_OF_UTTERANCE | Esse evento indica que o servidor detectou o fim da fala do usuário e não espera nenhuma fala adicional. Portanto, o servidor não processará áudio adicional, ainda que possa retornar resultados adicionais posteriormente. O cliente deve parar de enviar dados de áudio adicionais, fechar a metade da conexão gRPC e aguardar quaisquer resultados adicionais até o servidor fechar a conexão gRPC. | 
ConverseResult
O resultado semântico para a consulta falada do usuário.
| Campos | |
|---|---|
| spoken_request_text | 
 Somente saída A transcrição reconhecida do que o usuário disse. | 
| spoken_response_text | 
 Somente saída O texto da resposta falada do assistente. Esse valor só é retornado para uma ação IFTTT. | 
| conversation_state | 
 
                    Informações de estado somente saída para o  | 
| microphone_mode | 
                    Somente saída Especifica o modo do microfone depois que essa RPC  | 
| volume_percentage | 
 
                    Somente saída nível de volume atualizado. O valor será 0 ou omitido (indicando nenhuma alteração), a menos que um comando de voz como "Aumentar o volume" ou "Definir nível de volume 4" seja reconhecido. Nesse caso, o valor vai estar entre 1 e 100 (correspondente ao novo nível de volume de 1% a 100%). Normalmente, um cliente precisa usar esse nível de volume ao reproduzir os dados do  | 
MicrophoneMode
Estados possíveis do microfone após a conclusão de uma RPC Converse.
| Enums | |
|---|---|
| MICROPHONE_MODE_UNSPECIFIED | Nenhum modo especificado. | 
| CLOSE_MICROPHONE | O serviço não espera uma pergunta seguinte do usuário. O microfone precisa permanecer desativado até ser reativado. | 
| DIALOG_FOLLOW_ON | O serviço espera uma pergunta complementar do usuário. O microfone precisa ser aberto novamente quando a reprodução de AudioOutfor concluída, iniciando uma nova chamada de RPCConversepara enviar o novo áudio. | 
ConverseState
Fornece informações sobre o estado atual da caixa de diálogo.
| Campos | |
|---|---|
| conversation_state | 
 
                    Obrigatório O valor  | 
