Índice
- EmbeddedAssistant(interface)
- AssistConfig(mensagem)
- AssistRequest(mensagem)
- AssistResponse(mensagem)
- AssistResponse.EventType(enum)
- AudioInConfig(mensagem)
- AudioInConfig.Encoding(enum)
- AudioOut(mensagem)
- AudioOutConfig(mensagem)
- AudioOutConfig.Encoding(enum)
- DebugConfig(mensagem)
- DebugInfo(mensagem)
- DeviceAction(mensagem)
- DeviceConfig(mensagem)
- DeviceLocation(mensagem)
- DialogStateIn(mensagem)
- DialogStateOut(mensagem)
- DialogStateOut.MicrophoneMode(enum)
- ScreenOut(mensagem)
- ScreenOut.Format(enum)
- ScreenOutConfig(mensagem)
- ScreenOutConfig.ScreenMode(enum)
- SpeechRecognitionResult(mensagem)
EmbeddedAssistant
Serviço que implementa a API Google Assistant.
| Assistência | |
|---|---|
| 
 Inicia ou continua uma conversa com o serviço do Google Assistente incorporado. Cada chamada realiza uma viagem de ida e volta, enviando uma solicitação de áudio ao serviço e recebendo a resposta de áudio. Usa streaming bidirecional para receber resultados, como o evento  Uma conversa é uma ou mais conexões gRPC, cada uma consistindo em várias solicitações e respostas transmitidas. Por exemplo, o usuário diz Adicionar à minha lista de compras, e o Google Assistente responde O que você quer adicionar?. A sequência das solicitações e respostas transmitidas na primeira mensagem gRPC pode ser: 
 O usuário diz bagels, e o Google Assistente responde Ok, adicionei bagels à sua lista de compras. Isso é enviado como outra chamada de conexão gRPC para o método  
 Ainda que a ordem precisa das respostas não seja garantida, as mensagens  
 | |
AssistConfig
Especifica como processar as mensagens AssistRequest.
| Campos | ||
|---|---|---|
| audio_out_config | Obrigatório Especifica como formatar o áudio que será retornado. | |
| screen_out_config | Opcional Especifica o formato desejado a ser usado quando o servidor retornar uma resposta visual da tela. | |
| dialog_state_in | Obrigatório representa o estado atual da caixa de diálogo. | |
| device_config | Configuração que identifica exclusivamente um dispositivo específico. | |
| debug_config | 
                    Opcional Parâmetros de depuração para toda a RPC  | |
| Campo de união  
 | ||
| audio_in_config | 
                    Especifica como processar o áudio de entrada seguinte. Obrigatório se  | |
| text_query | 
 A entrada de texto que será enviada ao Google Assistente. que poderá ser preenchido em uma interface de texto se a entrada de áudio não estiver disponível; | |
AssistRequest
A mensagem de nível superior enviada pelo cliente. Os clientes precisam enviar pelo menos duas e, normalmente, várias mensagens AssistRequest. A primeira mensagem precisa conter uma mensagem config e não pode conter dados audio_in. Todas as mensagens subsequentes precisam conter dados audio_in e não podem conter uma mensagem config.
| Campos | ||
|---|---|---|
| Campo de união type. Exatamente um desses campos precisa ser especificado em cadaAssistRequest.typepode ser apenas de um dos tipos a seguir: | ||
| config | 
                    A mensagem  | |
| audio_in | 
 
                    Dados de áudio a serem reconhecidos. Os blocos sequenciais de dados de áudio são enviados em mensagens  | |
AssistResponse
A mensagem de nível superior recebida pelo cliente. É feito streaming de uma ou mais mensagens AssistResponse de volta para o cliente.
| Campos | |
|---|---|
| event_type | Somente saída Indica o tipo de evento. | 
| audio_out | Somente saída: o áudio que contém a resposta do Google Assistente à consulta. | 
| screen_out | Somente saída: contém a resposta visual do Google Assistente à consulta. | 
| device_action | Somente saída: contém a ação acionada pela consulta com os payloads e a análise semântica adequados. | 
| speech_results[] | 
                    Somente saída Esta lista repetida contém zero ou mais resultados de reconhecimento de fala que correspondem a porções consecutivas do áudio sendo processadas no momento, começando com a parte correspondente ao áudio mais antigo (e mais estável) até a parte correspondente ao áudio mais recente. As strings podem ser concatenadas para mostrar a resposta completa em andamento. Quando o reconhecimento de fala for concluído, a lista conterá um item com  | 
| dialog_state_out | Somente saída: contém a saída relacionada à consulta do usuário. | 
| debug_info | 
                    Somente saída Informações de depuração para o desenvolvedor. Retornará somente se a solicitação definir  | 
EventType
Indica o tipo de evento.
| Enums | |
|---|---|
| EVENT_TYPE_UNSPECIFIED | Nenhum evento especificado. | 
| END_OF_UTTERANCE | Esse evento indica que o servidor detectou o fim da fala do usuário e não espera nenhuma fala adicional. Portanto, o servidor não processará áudio adicional, ainda que possa retornar resultados adicionais posteriormente. O cliente deve parar de enviar dados de áudio adicionais, fechar a metade da conexão gRPC e aguardar quaisquer resultados adicionais até o servidor fechar a conexão gRPC. | 
AudioInConfig
Especifica como processar os dados do audio_in que serão fornecidos nas próximas solicitações. Para acessar as configurações recomendadas, consulte as práticas recomendadas do SDK do Google Assistente.
| Campos | |
|---|---|
| encoding | 
                    Obrigatório Codificação de dados de áudio enviados em todas as mensagens  | 
| sample_rate_hertz | 
 
                    Obrigatório Taxa de amostragem (em Hertz) dos dados de áudio enviados em todas as mensagens  | 
Codificação
Codificação de áudio dos dados enviados na mensagem de áudio. O áudio precisa ser de um canal (mono).
| Enums | |
|---|---|
| ENCODING_UNSPECIFIED | Não especificado. Retorna o resultado google.rpc.Code.INVALID_ARGUMENT. | 
| LINEAR16 | Amostras pouco elaboradas de 16 bits sem compactação (PCM Linear). Essa codificação não inclui cabeçalho, somente os bytes brutos de áudio. | 
| FLAC | FLAC(Free Lossless Audio Codec) é a codificação recomendada porque não tem perdas. Portanto, o reconhecimento não é comprometido e requer apenas cerca de metade da largura de banda doLINEAR16. Essa codificação inclui o cabeçalho de streamFLACseguido pelos dados de áudio. Ele oferece suporte a amostras de 16 e 24 bits, mas nem todos os campos emSTREAMINFOsão compatíveis. | 
AudioOut
O áudio que contém a resposta do Google Assistente à consulta. Os blocos sequenciais de dados de áudio são recebidos em mensagens AssistResponse sequenciais.
| Campos | |
|---|---|
| audio_data | 
 
                    Somente saída: os dados de áudio que contêm a resposta do Google Assistente à consulta. Os blocos sequenciais de dados de áudio são recebidos em mensagens  | 
AudioOutConfig
Especifica o formato desejado que o servidor usará quando retornar mensagens audio_out.
| Campos | |
|---|---|
| encoding | 
                    Obrigatório A codificação dos dados de áudio a ser retornada em todas as mensagens  | 
| sample_rate_hertz | 
 
                    Obrigatório A taxa de amostragem em Hertz dos dados de áudio retornados em mensagens  | 
| volume_percentage | 
 Obrigatório Configuração de volume atual da saída de áudio do dispositivo. Os valores válidos são de 1 a 100 (correspondente a 1% a 100%). | 
Codificação
Codificação dos dados retornados na mensagem de áudio. Todas as codificações são bytes de áudio brutos sem cabeçalho, exceto conforme indicado abaixo.
| Enums | |
|---|---|
| ENCODING_UNSPECIFIED | Não especificado. Retorna o resultado google.rpc.Code.INVALID_ARGUMENT. | 
| LINEAR16 | Amostras pouco elaboradas de 16 bits sem compactação (PCM Linear). | 
| MP3 | Codificação de áudio MP3. A taxa de amostragem é codificada no payload. | 
| OPUS_IN_OGG | Áudio codificado em Opus unido em um contêiner ogg. O resultado será um arquivo que pode ser reproduzido de forma nativa no Android e em alguns navegadores, como o Chrome. A qualidade da codificação é consideravelmente maior do que a do MP3 e usa a mesma taxa de bits. A taxa de amostragem é codificada no payload. | 
DebugConfig
Parâmetros de depuração para a solicitação atual.
| Campos | |
|---|---|
| return_debug_info | 
 
                    Quando esse campo é definido como verdadeiro, o campo  | 
DebugInfo
Informações de depuração para o desenvolvedor. Retornará somente se a solicitação definir return_debug_info como "true".
| Campos | |
|---|---|
| aog_agent_to_assistant_json | 
 A resposta JSON original de um agente do Action-on-Google para o servidor do Google. Consulte AppResponse. Ele só será preenchido se o criador da solicitação for proprietário do projeto AoG e se ele estiver no modo de visualização. | 
DeviceAction
A resposta retornada ao dispositivo se o usuário tiver acionado uma ação do dispositivo. Por exemplo, um dispositivo compatível com a consulta Turn on the light receberia um DeviceAction com um payload JSON que contém a semântica da solicitação.
| Campos | |
|---|---|
| device_request_json | 
 
                    JSON que contém a resposta ao comando do dispositivo gerada com base na gramática de ações do dispositivo acionadas. O formato é fornecido pela intent  | 
DeviceConfig
Campos obrigatórios que identificam o dispositivo para o Google Assistente.
Consulte também:
| Campos | |
|---|---|
| device_id | 
 Obrigatório Identificador exclusivo do dispositivo. O ID precisa ter até 128 caracteres. Exemplo: DBCDW098234. Ele PRECISA corresponder ao device_id retornado do registro do dispositivo. Esse device_id é usado para corresponder aos dispositivos registrados do usuário e pesquisar as características e os recursos compatíveis com o dispositivo. Essas informações não devem mudar após a reinicialização do dispositivo. No entanto, ele não deve ser salvo após as redefinições para a configuração original. | 
| device_model_id | 
 Obrigatório Identificador exclusivo do modelo do dispositivo. A combinação de device_model_id e device_id precisa ter sido associada anteriormente ao registro do dispositivo. | 
DeviceLocation
Existem três origens de locais. Eles são usados com esta precedência:
- Esse DeviceLocation, que é usado principalmente para dispositivos móveis com GPS .
- Local especificado pelo usuário durante a configuração do dispositivo, por usuário e por dispositivo. Esse local será usado se DeviceLocationnão for especificado.
- Local inferido com base no endereço IP. Isso será usado somente se nenhuma das opções acima for especificada.
| Campos | |
|---|---|
| coordinates | Latitude e longitude do dispositivo. | 
DialogStateIn
Fornece informações sobre o estado atual da caixa de diálogo.
| Campos | |
|---|---|
| conversation_state | 
 
                    Obrigatório Esse campo sempre precisa ser definido como o valor  | 
| language_code | 
 
                    Obrigatório Idioma da solicitação na sintaxe IETF BCP 47 (por exemplo, "en-US"). Consulte Suporte a idiomas para mais informações. Se você tiver selecionado um idioma para o  | 
| device_location | Opcional: local do dispositivo em que a consulta foi originada. | 
| is_new_conversation | 
 Opcional: se verdadeiro, o servidor vai tratar a solicitação como uma nova conversa e não usar o estado da solicitação anterior. Defina este campo como verdadeiro quando a conversa precisar ser reiniciada, por exemplo, após a reinicialização do dispositivo ou após um intervalo de tempo significativo desde a consulta anterior. | 
DialogStateOut
O estado da caixa de diálogo resultante da consulta do usuário. Várias destas mensagens podem ser recebidas.
| Campos | |
|---|---|
| supplemental_display_text | 
 
                    Somente saída Texto de exibição complementar do Google Assistente. Pode ser a mesma fala falada em  | 
| conversation_state | 
 
                    Informações de estado somente saída para a RPC  | 
| microphone_mode | 
                    Somente saída Especifica o modo do microfone depois que essa RPC  | 
| volume_percentage | 
 
                    Somente saída nível de volume atualizado. O valor será 0 ou omitido (indicando nenhuma mudança), a menos que um comando de voz como Aumentar o volume ou Definir nível de volume 4 seja reconhecido. Nesse caso, o valor vai estar entre 1 e 100 (correspondente ao novo nível de volume de 1% a 100%). Normalmente, um cliente precisa usar esse nível de volume ao reproduzir os dados do  | 
MicrophoneMode
Estados possíveis do microfone após a conclusão de uma RPC Assist.
| Enums | |
|---|---|
| MICROPHONE_MODE_UNSPECIFIED | Nenhum modo especificado. | 
| CLOSE_MICROPHONE | O serviço não espera uma pergunta seguinte do usuário. O microfone precisa permanecer desativado até ser reativado. | 
| DIALOG_FOLLOW_ON | O serviço espera uma pergunta complementar do usuário. O microfone precisa ser aberto novamente quando a reprodução de AudioOutfor concluída, iniciando uma nova chamada de RPCAssistpara enviar o novo áudio. | 
ScreenOut
A resposta da saída visual do Google Assistente à consulta. Ativado por screen_out_config.
| Campos | |
|---|---|
| format | Somente saída Formato dos dados da tela fornecidos. | 
| data | 
 Somente saída: os dados brutos da tela a serem mostrados como resultado da consulta do Google Assistente. | 
Formato
Formatos possíveis dos dados da tela.
| Enums | |
|---|---|
| FORMAT_UNSPECIFIED | Nenhum formato especificado. | 
| HTML | Os dados contêm um layout HTML5 completo codificado em UTF-8, por exemplo, <html><body><div>...</div></body></html>. Ele precisa ser renderizado junto com a resposta de áudio. O doctype HTML5 precisa ser incluído nos dados HTML reais. | 
ScreenOutConfig
Especifica o formato desejado para o servidor usar quando ele retornar uma resposta screen_out.
| Campos | |
|---|---|
| screen_mode | Modo de tela visual atual do dispositivo durante a emissão da consulta. | 
ScreenMode
Modos possíveis para saída visual da tela no dispositivo.
| Enums | |
|---|---|
| SCREEN_MODE_UNSPECIFIED | Nenhum modo de vídeo especificado. O Google Assistente pode responder como se estivesse no modo OFF. | 
| OFF | A tela está desligada (ou tem o brilho ou outras configurações tão baixas que não são visíveis). O Google Assistente normalmente não retorna uma resposta de tela nesse modo. | 
| PLAYING | Nesse modo, o Google Assistente normalmente retorna uma resposta de tela parcial. | 
SpeechRecognitionResult
A transcrição estimada de uma frase que o usuário falou. Pode ser um único segmento ou o palpite completo da consulta falada do usuário.
| Campos | |
|---|---|
| transcript | 
 Somente saída Texto de transcrição que representa as palavras que o usuário falou. | 
| stability | 
 
                    Somente saída: estimativa da probabilidade de o Google Assistente não mudar o palpite sobre esse resultado. Os valores variam de 0,0 (completamente instável) a 1,0 (completamente estável e final). O padrão de 0,0 é um valor de sentinela indicando que  | 
