Konuşma İşlemleri 13 Haziran 2023'te kullanımdan kaldırıldı. Daha fazla bilgi için Görüşme İşlemlerinin kullanımdan kaldırılması sayfasına göz atın.

Bu sayfa, Cloud Translation API ile çevrilmiştir.

SSML (Dialogflow)

Google Asistan'a yanıt verirken yanıtlarınızda Konuşma Sentezi Biçimlendirme Dili'nin (SSML) bir alt kümesini kullanabilirsiniz. SSML kullanarak görüşmenizdeki yanıtların doğal konuşma gibi görünmesini sağlayabilirsiniz. Aşağıda, SSML işaretlemesinin bir örneği ve bu işaretlemenin Google Asistan tarafından nasıl okunduğu gösterilmektedir.

SSML

function saySSML(conv) {
  const ssml = '<speak>' +
    'Here are <say-as interpret-as="characters">SSML</say-as> samples. ' +
    'I can pause <break time="3" />. ' +
    'I can play a sound <audio src="https://www.example.com/MY_WAVE_FILE.wav">your wave file</audio>. ' +
    'I can speak in cardinals. Your position is <say-as interpret-as="cardinal">10</say-as> in line. ' +
    'Or I can speak in ordinals. You are <say-as interpret-as="ordinal">10</say-as> in line. ' +
    'Or I can even speak in digits. Your position in line is <say-as interpret-as="digits">10</say-as>. ' +
    'I can also substitute phrases, like the <sub alias="World Wide Web Consortium">W3C</sub>. ' +
    'Finally, I can speak a paragraph with two sentences. ' +
    '<p><s>This is sentence one.</s><s>This is sentence two.</s></p>' +
    '</speak>';
  conv.ask(ssml);
}

JSON

{
  "expectUserResponse": true,
  "expectedInputs": [
    {
      "possibleIntents": [
        {
          "intent": "actions.intent.TEXT"
        }
      ],
      "inputPrompt": {
        "richInitialPrompt": {
          "items": [
            {
              "simpleResponse": {
                "textToSpeech": "<speak>Here are <say-as interpret-as=\"characters\">SSML</say-as> samples. I can pause <break time=\"3\" />. I can play a sound <audio src=\"https://www.example.com/MY_WAVE_FILE.wav\">your wave file</audio>. I can speak in cardinals. Your position is <say-as interpret-as=\"cardinal\">10</say-as> in line. Or I can speak in ordinals. You are <say-as interpret-as=\"ordinal\">10</say-as> in line. Or I can even speak in digits. Your position in line is <say-as interpret-as=\"digits\">10</say-as>. I can also substitute phrases, like the <sub alias=\"World Wide Web Consortium\">W3C</sub>. Finally, I can speak a paragraph with two sentences. <p><s>This is sentence one.</s><s>This is sentence two.</s></p></speak>"
              }
            }
          ]
        }
      }
    }
  ]
}

Ses

SSML, Actions simülatöründe desteklenir ancak Dialogflow simülatöründe desteklenmez.

SSML'deki URL'ler

Yalnızca URL içeren bir SSML yanıtı tanımlarken, bu URL'deki "ve" işaretleri XML biçimlendirmesi nedeniyle sorunlara neden olabilir. URL'ye doğru şekilde referans verildiğinden emin olmak için & örneklerini & ile değiştirin.

SSML yanıtınız yalnızca bir URL içerse bile Actions on Google'da yanıt için görüntüleme metni gerekir. <audio> etiketi içindeki metin Asistan tarafından okunmayacağından, bu koşulu karşılamak için <audio> etiketinize dolgu metni veya kısa bir açıklama ekleyebilirsiniz. <audio> etiketi içindeki metin, ses çaldıktan sonra Asistan tarafından seslendirilmez ve Google'ın SSML'nizin görüntülü metin sürümü için İşlem'in gereksinimlerini karşılar.

Sorunlu bir SSML yanıtı örneği:

<speak>
  <audio src="https://firebasestorage.googleapis.com/v0/b/project-name.appspot.com/o/audio-file-name.ogg?alt=media&token=XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX">
  </audio>
</speak>

Yukarıdaki örnek, doğru XML biçimlendirmesi için & dışına çıkmaz.

Aynı SSML yanıtının sabit bir sürümü şöyle görünür:

<speak>
  <audio src="https://firebasestorage.googleapis.com/v0/b/project-name.appspot.com/o/audio-file-name.ogg?alt=media&amp;token=XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX">
  text
  </audio>
</speak>

SSML öğeleri için destek

Aşağıdaki bölümlerde, İşlemlerinizde kullanılabilecek SSML öğeleri ve seçenekleri açıklanmaktadır.

`<speak>`

SSML yanıtının kök öğesi.

speak öğesi hakkında daha fazla bilgi için W3 spesifikasyonuna bakın.

Örnek

<speak>
  my SSML content
</speak>

`<break>`

Kelimeler arasındaki duraklatma veya diğer prosodik sınırları kontrol eden boş bir öğe. Herhangi bir jeton çifti arasında <break> kullanılması isteğe bağlıdır. Bu öğe, kelimeler arasında mevcut değilse boşluk, dilsel bağlama göre otomatik olarak belirlenir.

break öğesi hakkında daha fazla bilgi için W3 spesifikasyonuna bakın.

Özellikler

Özellik Açıklama

Özellik	Açıklama
`time`	Ara uzunluğunu saniye veya milisaniye cinsinden ayarlar (ör. "3 sn" veya "250 ms").
`strength`	Çıkışın prosodik kırılma gücünü göreli terimlere göre ayarlar. Geçerli değerler şunlardır: "x-zayıf", "orta", "güçlü" ve "x-güçlü". "none" değeri, işlemcinin aksi halde üretebileceği prosodik bir kırılmayı önlemek için kullanılabilir, prosodik ara sınırı için çıkış yapılmaması gerektiğini gösterir. Diğer değerler, jetonlar arasında monoton olarak azalmayan (kavramsal olarak artan) kırılma gücünü gösterir. Daha güçlü sınırlara genellikle duraklamalar eşlik eder.

time

Ara uzunluğunu saniye veya milisaniye cinsinden ayarlar (ör. "3 sn" veya "250 ms").

strength

Çıkışın prosodik kırılma gücünü göreli terimlere göre ayarlar. Geçerli değerler şunlardır: "x-zayıf", "orta", "güçlü" ve "x-güçlü". "none" değeri, işlemcinin aksi halde üretebileceği prosodik bir kırılmayı önlemek için kullanılabilir, prosodik ara sınırı için çıkış yapılmaması gerektiğini gösterir. Diğer değerler, jetonlar arasında monoton olarak azalmayan (kavramsal olarak artan) kırılma gücünü gösterir. Daha güçlü sınırlara genellikle duraklamalar eşlik eder.

Örnek

Aşağıdaki örnekte, adımlar arasında duraklamak için <break> öğesinin nasıl kullanılacağı gösterilmektedir:

<speak>
  Step 1, take a deep breath. <break time="200ms"/>
  Step 2, exhale.
  Step 3, take a deep breath again. <break strength="weak"/>
  Step 4, exhale.
</speak>

`<say‑as>`

Bu öğe, öğenin içinde bulunan metin yapısının türüyle ilgili bilgileri belirtebilmenizi sağlar. Ayrıca, içerilen metnin oluşturulması için ayrıntı düzeyinin belirtilmesine de yardımcı olur.

<say‑as> öğesi, değerin nasıl okunacağını belirleyen gerekli interpret-as özelliğine sahiptir. Özel interpret-as değerine bağlı olarak isteğe bağlı format ve detail özellikleri kullanılabilir.

Örnekler

interpret-as özelliği aşağıdaki değerleri destekler:

currency
Aşağıdaki örnekte "kırk iki dolar bir sent" olarak kullanılmaktadır. Dil özelliği atlanırsa geçerli yerel ayar kullanılır.
```
<speak>
 <say-as interpret-as='currency' language='en-US'>$42.01</say-as>
</speak>
 
```
telephone
W3C SSML 1.0 özellik değerleri olarak say WG notundaki interpret-as='telephone' açıklamasına bakın.

Aşağıdaki örnek "bir sekiz sıfır sıfır iki sıfır iki bir iki bir iki" şeklinde söylenir. "google:style" özelliği atlanırsa sıfır, O harfi olarak okunur.

"google:style='sıfır-sıfır'" özelliği şu anda yalnızca İngilizce yerel ayarlarda çalışmaktadır.
```
 <speak>
 <say-as interpret-as='telephone' google:style='zero-as-zero'>1800-202-1212</say-as>
 </speak>
 
```
verbatim veya spell-out
Aşağıdaki örnekte harf harf yazılmış:
```
<speak>
 <say-as interpret-as="verbatim">abcdefg</say-as>
</speak>
 
```
Tarayıcınız HTML5 Ses öğesini desteklemiyor.
date
format özelliği, tarih alanı karakter kodlarından oluşan bir dizidir. format öğesinde desteklenen alan karakter kodları, sırasıyla yıl, ay ve ayın (ayın) için sırasıyla {y, m, d} şeklindedir. Alan kodu yıl, ay ve gün için bir kez görünüyorsa beklenen basamak sayısı sırasıyla 4, 2 ve 2'dir. Alan kodu tekrarlanıyorsa beklenen basamak sayısı, kodun tekrarlanma sayısıdır. Tarih metnindeki alanlar noktalama işaretleri ve/veya boşluklarla ayrılabilir.

detail özelliği, tarihin sözlü biçimini kontrol eder. detail='1' için yalnızca gün ve ay ya da yıl alanlarının doldurulması zorunludur ancak her ikisi de sağlanabilir. Üç alanın hepsinden az alan verildiğinde varsayılan olarak bu ayar kullanılır. Söylenen biçim şu şekildedir: "The {ordinal day} of {month}, {year}".

Aşağıdaki örnek "On Eylül, on dokuz altmış" şeklinde telaffuz edilir:
```
<speak>
 <say-as interpret-as="date" format="yyyymmdd" detail="1">
 1960-09-10
 </say-as>
</speak>
 
```
Tarayıcınız HTML5 Ses öğesini desteklemiyor.

Aşağıdaki örnekte "Eylül'ün 10'u" olarak geçmektedir:
```
<speak>
 <say-as interpret-as="date" format="dm">10-9</say-as>
</speak>
 
```
Tarayıcınız HTML5 Ses öğesini desteklemiyor.

detail='2' için gün, ay ve yıl alanları zorunludur. Üç alan da sağlandığında bu varsayılan ayardır. Sesli ifade "{month} {ordinal day}, {year}" şeklindedir.

Şu örnek, "on Eylül, on dokuz altmış" şeklinde telaffuz edilir:
```
<speak>
 <say-as interpret-as="date" format="dmy" detail="2">
 10-9-1960
 </say-as>
</speak>
 
```
Tarayıcınız HTML5 Ses öğesini desteklemiyor.
characters
Aşağıdaki örnek "C A N" olarak söylenir:
```
<speak>
 <say-as interpret-as="characters">can</say-as>
</speak>
 
```
Tarayıcınız HTML5 Ses öğesini desteklemiyor.
cardinal
Aşağıdaki örnek "On iki bin üç yüz kırk beş" (ABD İngilizcesi için) veya "On iki bin üç yüz kırk beş (İngiltere İngilizcesi için)" olarak söylenir:
```
<speak>
 <say-as interpret-as="cardinal">12345</say-as>
</speak>
 
```
Tarayıcınız HTML5 Ses öğesini desteklemiyor.
ordinal
Aşağıdaki örnek "First" olarak okunur:
```
<speak>
 <say-as interpret-as="ordinal">1</say-as>
</speak>
 
```
Tarayıcınız HTML5 Ses öğesini desteklemiyor.
fraction
Aşağıdaki örnek "beş buçuk" olarak söylenir:
```
<speak>
 <say-as interpret-as="fraction">5+1/2</say-as>
</speak>
 
```
Tarayıcınız HTML5 Ses öğesini desteklemiyor.
expletive veya bleep
Aşağıdaki örnek, sansürlenmiş gibi bip sesi olarak çıkar:
```
<speak>
 <say-as interpret-as="expletive">censor this</say-as>
</speak>
 
```
Tarayıcınız HTML5 Ses öğesini desteklemiyor.
unit
Birimleri sayıya bağlı olarak tekil veya çoğul biçime dönüştürür. Aşağıdaki örnekte "10 fit" olarak söylenir:
```
<speak>
 <say-as interpret-as="unit">10 foot</say-as>
</speak>
 
```
Tarayıcınız HTML5 Ses öğesini desteklemiyor.
time
Aşağıdaki örnek "23:00" olarak söylenir:
```
<speak>
 <say-as interpret-as="time" format="hms12">2:30pm</say-as>
</speak>
 
```
Tarayıcınız HTML5 Ses öğesini desteklemiyor.

format özelliği, zaman alanı karakter kodları dizisidir. format öğesinde desteklenen alan karakter kodları sırasıyla saat, dakika (saat), ikinci (dakika), saat dilimi, 12 saatlik ve 24 saatlik zaman için {h,m, s, Z, 12, 24} şeklindedir. Alan kodu saat, dakika ve saniye boyunca bir kez görünüyorsa beklenen basamak sayısı sırasıyla 1, 2 ve 2'dir. Alan kodu tekrarlanıyorsa beklenen basamak sayısı, kodun tekrarlanma sayısıdır. Zaman metnindeki alanlar noktalama işaretleri ve/veya boşluklarla ayrılabilir. Biçimde saat, dakika veya saniye belirtilmezse veya eşleşen basamak yoksa alan sıfır değeri olarak kabul edilir. Varsayılan format değeri "hms12"dir.

detail özelliği, saatin sözlü biçiminin 12 saat mi yoksa 24 saat mi olduğunu kontrol eder. detail='1' veya detail atlanırsa sözlü biçim 24 saat biçiminde olur ve saat biçimi 24 saattir. detail='2' veya detail atlanırsa sözlü biçim 12 saatlik biçimdir ve saat biçimi 12 saattir.

say-as öğesi hakkında daha fazla bilgi için W3 spesifikasyonuna bakın.

`<audio>`

Sentezlenmiş konuşma çıkışıyla birlikte kaydedilen ses dosyalarının ve diğer ses biçimlerinin eklenmesini destekler.

Özellikler

Özellik	Gerekli	Varsayılan	Değerler
`src`	evet	Yok	Ses medya kaynağını belirten bir URI. Desteklenen protokol: `https`.
`clipBegin`	no	0	Ses kaynağının çalmaya başlama zamanıyla arasındaki ofseti belirten TimeDesignation (Zaman Tanımı). Bu değer, ses kaynağının gerçek süresinden büyükse veya ona eşitse ses eklenmez.
`clipEnd`	no	sonsuz	Ses kaynağının oynatmanın başlangıcından bitişine kadar olan ofseti ifade eden bir TimeDesignation. Ses kaynağının gerçek süresi bu değerden kısaysa oynatma o noktada sona erer. `clipBegin`, `clipEnd` değerinden büyükse veya ona eşitse ses eklenmez.
`speed`	no	%100	Normal giriş hızına göre oran çıkış oynatma hızı ve yüzde olarak ifade edilir. Biçim, pozitif bir Gerçek Sayı ve ardından %'dir. Şu anda desteklenen aralık [%50 (yavaş - yarı hız), %200 (hızlı - çift hız)] şeklindedir. Bu aralığın dışındaki değerler, aralık dahilinde olacak şekilde ayarlanabilir (veya düzenlenmeyebilir).
`repeatCount`	no	1 veya `repeatDur` ayarlandıysa 10	Sesin kaç kez ekleneceğini belirten bir Gerçek Sayı (varsa, `clipBegin` ve/veya `clipEnd` tarafından kırpıldıktan sonra). Kesirli tekrarlar desteklenmediğinden değer en yakın tam sayıya yuvarlanır. Sıfır geçerli bir değer değildir ve bu nedenle belirtilmemiş olarak kabul edilir ve bu durumda varsayılan değere sahiptir.
`repeatDur`	no	sonsuz	`clipBegin`, `clipEnd`, `repeatCount` ve `speed` özellikleri için (bunun yerine normal oynatma süresi yerine) kaynak işlendikten sonra eklenen sesin süresini sınırlayan bir TimeDesignation. İşlenen sesin süresi bu değerden kısaysa oynatma o noktada sona erer.
`soundLevel`	no	+0dB	Sesin ses seviyesini `soundLevel`desibel kadar ayarlayın. Maksimum aralık +/-40 dB'dir, ancak gerçek aralık etkin bir şekilde daha az olabilir ve çıkış kalitesi aralığın tamamında iyi sonuçlar vermeyebilir.

Şu anda ses için desteklenen ayarlar şunlardır:

Biçim: MP3 (MPEG v2)
- Saniyede 24.000 örnek
- 24K ~ 96 K bit/saniye, sabit hızlı
Biçim: Ogg'de Opus
- Saniyede 24.000 örnek (süper geniş bant)
- 24K - 96 K bit/saniye, sabit hızlı
Biçim (kullanımdan kaldırıldı): WAV (RIFF)
- PCM 16 bit imzalı, küçük endian
- Saniyede 24.000 örnek
Tüm biçimler için:
- Tek kanal tercih edilir, ancak stereo kabul edilir.
- Maksimum süre 240 saniye. Daha uzun bir ses dosyası oynatmak istiyorsanız bir medya yanıtı uygulamayı deneyin.
- 5 megabayt dosya boyutu sınırı.
- Kaynak URL'de HTTPS protokolü kullanılmalıdır.
- Ses getirme işlemindeki UserAgent'ımız "Google-Speech-Actions"tır.

<audio> öğesinin içeriği isteğe bağlıdır ve ses dosyası çalınamadığında veya çıkış cihazı sesi desteklemiyorsa kullanılır. İçerik bir <desc> öğesi içerebilir. Bu durumda, bu öğenin metin içeriği görüntüleme için kullanılır. Daha fazla bilgi için Yanıtlar için Yapılacaklar Listesi'ndeki Ses Kaydı bölümüne bakın.

src URL'si de bir https URL'si olmalıdır (Google Cloud Storage, ses dosyalarınızı bir https URL'sinde barındırabilir).

Medya yanıtları hakkında daha fazla bilgi edinmek için Yanıtlar kılavuzundaki medya yanıtı bölümüne bakın.

audio öğesi hakkında daha fazla bilgi için W3 spesifikasyonuna bakın.

Örnek

<speak>
  <audio src="cat_purr_close.ogg">
    <desc>a cat purring</desc>
    PURR (sound didn't load)
  </audio>
</speak>

`,<s>`

Cümle ve paragraf öğeleri.

p ve s öğeleri hakkında daha fazla bilgi edinmek için W3 spesifikasyonuna bakın.

Örnek

<p><s>This is sentence one.</s><s>This is sentence two.</s></p>

En iyi uygulamalar

Özellikle de prozodiyi değiştiren SSML öğeleri (yani <audio>, <break>, <emphasis>, <par>, <prosody>, <say-as>, <seq> ve ) içeren tam cümleleri sarmalamak için <s>...</s> etiketlerini kullanın.
Konuşmadaki aranın duyulacak kadar uzun olması amaçlanıyorsa, <s>...</s> etiketlerini kullanın ve bu arayı cümleler arasına yerleştirin.

``

Takma ad özellik değerindeki metnin, telaffuzda bulunan metnin yerini aldığını belirtin.

Okunması zor bir kelimenin basitleştirilmiş bir telaffuzunu sağlamak için sub öğesini de kullanabilirsiniz. Aşağıdaki son örnek, bu kullanım alanını Japonca olarak göstermektedir.

sub öğesi hakkında daha fazla bilgi için W3 spesifikasyonuna bakın.

Örnekler

<sub alias="World Wide Web Consortium">W3C</sub>

<sub alias="にっぽんばし">日本橋</sub>

``

Metne veya etiket dizisine bir işaretçi yerleştiren boş öğe. Dizideki belirli bir konuma referans vermek veya eşzamansız bildirim için çıkış akışına bir işaretçi eklemek üzere kullanılabilir.

Not: mark öğesini kullanırken aşağıdaki yönergeleri uygulayın:

SSML'nin başına veya sonuna yakın özel işaretler eklemek yerine START ve END işaretlerini kullanın.
SSML'nizde ardışık işaretler eklemeyin. Art arda gelen işaretler etkinlik oluşturmayabilir. Ayrıca, işaretler arasında ses oluşturulmazsa etkinlik oluşturulmaz. Örneğin, aşağıdakileri yapmaktan kaçının:
Sentence 1. Sentence 2.

Not: Kolaylık olması açısından Etkileşimli Tuval için yanıtlarınızda otomatik olarak START ve END etkinlikleri alırsınız. Bu işaretler W3 spesifikasyonuna dahil değildir.

mark öğesi hakkında daha fazla bilgi için W3 spesifikasyonuna bakın.

Örnek

<speak>
Go from <mark name="here"/> here, to <mark name="there"/> there!
</speak>

`<prosody>`

Öğenin içerdiği metin ses tonunu, konuşma hızını ve ses düzeyini özelleştirmek için kullanılır. Şu anda rate, pitch ve volume özellikleri desteklenmektedir.

rate ve volume özellikleri, W3 özelliklerine göre ayarlanabilir. pitch özelliğinin değerini ayarlamak için kullanabileceğiniz üç seçenek vardır:

Not: <prosody> etiketleri yalnızca tam cümle çevresinde kullanılmalıdır. Cümle içine kelime eklemek, konuşmada istenmeyen duraklamalara neden olabilir.

Özellik	Açıklama
`name`	Her işaretin dize kimliği.

Option	Açıklama
Akraba	"orta"nın varsayılan ses perdesi olduğu göreli bir değer (ör. "düşük", "orta", "yüksek" vb.) belirtin.
Semitonlar	"+Nst" veya "-Nst" kullanarak ses perdesini "N" yarım tonlarını artırın veya azaltın. "+/-" ve "st" değerlerinin gerekli olduğunu unutmayın.
Yüzde	Ses perdesini yüzde "N" oranında artırın veya azaltın. Bunun için sırasıyla "+%N" veya "-%N" değerini kullanın. "%" gerekliyken "+/-" isteğe bağlıdır.

prosody öğesi hakkında daha fazla bilgi için W3 spesifikasyonuna bakın.

Örnek

Aşağıdaki örnekte normalden 2 yarım seste yavaş bir şekilde konuşmak için <prosody> öğesi kullanılmaktadır:

<prosody rate="slow" pitch="-2st">Can you hear me now?</prosody>

`<emphasis>`

Öğenin içerdiği metne vurgu eklemek veya mevcut vurguyu kaldırmak için kullanılır. <emphasis> öğesi konuşmayı <prosody> özelliğine benzer şekilde değiştirir, ancak bağımsız konuşma özelliklerini ayarlamaya gerek kalmaz.

Not: <emphasis> etiketleri yalnızca tam cümle çevresinde kullanılmalıdır. Cümle içine kelime eklemek, konuşmada istenmeyen duraklamalara neden olabilir.

Bu öğe, aşağıdaki geçerli değerleri içeren isteğe bağlı bir "level" özelliğini destekler:

strong
moderate
none
reduced

emphasis öğesi hakkında daha fazla bilgi için W3 spesifikasyonuna bakın.

Örnek

Aşağıdaki örnekte duyuru yapmak için <emphasis> öğesi kullanılmaktadır:

<emphasis level="moderate">This is an important announcement</emphasis>

`<par>`

Aynı anda birden çok medya öğesini oynatmanıza olanak tanıyan paralel medya kapsayıcısı. Yalnızca bir veya daha fazla <par>, <seq> ve <media> öğesine izin verilir. <media> öğelerinin sırası önemli değil.

Alt öğe farklı bir başlangıç zamanı belirtmediği sürece öğenin örtülü başlangıç zamanı, <par> kapsayıcısıyla aynı olur. Bir alt öğenin begin veya end özelliği için ayarlanmış bir ofset değeri varsa öğenin göreli konumu, <par> kapsayıcısının başlangıç zamanına göre olur. Kök <par> öğesi için start özelliği yok sayılır ve başlangıç zamanı, SSML konuşma sentezi işleminin kök <par> öğesi için çıkış oluşturmaya başladığı zamandır (yani etkin olarak "sıfır" olarak ayarlanır).

Örnek

<speak>
  <par>
    <media xml:id="question" begin="0.5s">
      <speak>Who invented the Internet?</speak>
    </media>
    <media xml:id="answer" begin="question.end+2.0s">
      <speak>The Internet was invented by cats.</speak>
    </media>
    <media begin="answer.end-0.2s" soundLevel="-6dB">
      <audio
        src="https://actions.google.com/.../cartoon_boing.ogg"/>
    </media>
    <media repeatCount="3" soundLevel="+2.28dB"
      fadeInDur="2s" fadeOutDur="0.2s">
      <audio
        src="https://actions.google.com/.../cat_purr_close.ogg"/>
    </media>
  </par>
</speak>

`<seq>`

Medya öğelerini birbiri ardına oynatmanızı sağlayan sıralı medya kapsayıcısı. Yalnızca bir veya daha fazla <seq>, <par> ve <media> öğesine izin verilir. Medya öğelerinin sırası, oluşturuldukları sıradır.

Alt öğelerin begin ve end özellikleri, ofset değerlerine ayarlanabilir (aşağıdaki Zaman Spesifikasyonu bölümüne bakın). Bu alt öğelerin ofset değerleri, dizideki önceki öğenin sonuna veya dizideki ilk öğenin sonuna göre, <seq> kapsayıcısının başlangıcına göre olur.

Örnek

<speak>
  <seq>
    <media begin="0.5s">
      <speak>Who invented the Internet?</speak>
    </media>
    <media begin="2.0s">
      <speak>The Internet was invented by cats.</speak>
    </media>
    <media soundLevel="-6dB">
      <audio
        src="https://actions.google.com/.../cartoon_boing.ogg"/>
    </media>
    <media repeatCount="3" soundLevel="+2.28dB"
      fadeInDur="2s" fadeOutDur="0.2s">
      <audio
        src="https://actions.google.com/.../cat_purr_close.ogg"/>
    </media>
  </seq>
</speak>

`<media>`

<par> veya <seq> öğesi içindeki bir medya katmanını temsil eder. İzin verilen <media> öğesi içeriği, SSML <speak> veya <audio> öğesidir. Aşağıdaki tabloda bir <media> öğesi için geçerli özellikler açıklanmaktadır.

Özellikler

Özellik	Gerekli	Varsayılan	Değerler
xml:id	no	değer yok	Bu öğe için benzersiz bir XML tanımlayıcısı. Kodlanmış varlıklar desteklenmez. İzin verilen tanımlayıcı değerleri `"([-_#]\|\p{L}\|\p{D})+"` normal ifadesiyle eşleşiyor. Daha fazla bilgi için XML-ID bölümünü inceleyin.
başlangıç	no	0	Bu medya kapsayıcısının başlangıç zamanı. Bu, kök medya kapsayıcı öğesiyse yoksayılır (varsayılan "0" ile aynı şekilde işlenir). Geçerli dize değerleri için aşağıdaki Zaman spesifikasyonu bölümüne bakın.
bitiş	no	değer yok	Bu medya kapsayıcısının bitiş zamanının spesifikasyonu. Geçerli dize değerleri için aşağıdaki Zaman spesifikasyonu bölümüne bakın.
repeatCount	no	1	Medyanın kaç kez ekleneceğini belirten Gerçek Sayı. Kesirli tekrarlar desteklenmediği için değer en yakın tam sayıya yuvarlanır. Sıfır geçerli bir değer değildir ve bu nedenle belirtilmemiş olarak kabul edilir ve bu durumda varsayılan değere sahiptir.
repeatDur	no	değer yok	Takılan medyanın süresiyle ilgili sınır olan bir TimeDesignation (Zaman Tanımı). Medya süresi bu değerden kısaysa oynatma o noktada sona erer.
soundLevel	no	+0dB	Sesin ses seviyesini `soundLevel` desibel kadar ayarlayın. Maksimum aralık +/-40 dB'dir, ancak gerçek aralık etkin bir şekilde daha az olabilir ve çıkış kalitesi aralığın tamamında iyi sonuçlar vermeyebilir.
fadeInDur	no	0 sn.	Medyanın sessiz moddan isteğe bağlı olarak `soundLevel` öğesine geçtiği TimeDesignation (Zaman Tanımı). Medya süresi bu değerden kısaysa kararma, oynatmanın sonunda durur ve ses düzeyi belirtilen ses seviyesine ulaşmaz.
fadeOutDur	no	0 sn.	Medyanın, sessize dek isteğe bağlı olarak belirtilen `soundLevel` öğesinden karartılacağı bir TimeDesignation. Medya süresi bu değerden kısaysa oynatmanın sonunda sessizliğe ulaşıldığından emin olmak için ses düzeyi daha düşük bir değere ayarlanır.

Zaman belirtimi

<media> öğelerinin ve medya kapsayıcılarının (<par> ve <seq> öğeleri) "begin" ve "end" özellikleri için kullanılan zaman spesifikasyonu, ofset değeri (ör. +2.5s) veya senkronizasyon tabanı değeridir (ör. foo_id.end-250ms).

Ofset değeri: Zaman farkı değeri, normal ifadeyle eşleşen değerlere izin veren bir SMIL zaman sayımı değeridir: "\s\*(+|-)?\s\*(\d+)(\.\d+)?(h|min|s|ms)?\s\*"
İlk basamak dizesi, ondalık sayının tam bölümüdür, ikinci basamak dizesi ise ondalık kesirli kesirden oluşur. Varsayılan işaret ("(+|-)?") "+"dır. Birim değerleri sırasıyla saat, dakika, saniye ve milisaniyeye karşılık gelir. Birimler için varsayılan değer "s" (saniye) şeklindedir.
Syncbase değeri: Senkronizasyon tabanı değeri, normal ifadeyle eşleşen değerlere izin veren bir SMIL senkronizasyon tabanı değeridir: "([-_#]|\p{L}|\p{D})+\.(begin|end)\s\*(+|-)\s\*(\d+)(\.\d+)?(h|min|s|ms)?\s\*"
Rakamlar ve birimler, ofset değeriyle aynı şekilde yorumlanır.

TTS simülasyon aracı

Actions Console, yukarıdaki öğelerin herhangi biriyle SSML'yi test etmek için kullanabileceğiniz bir TTS simülasyon aracı içerir. TTS simülasyon aracını konsolda Simülatör > Ses altında bulabilirsiniz. Simülatöre metninizi ve SSML'nizi yazın, TTS çıkışını dinlemek için Güncelle ve Dinle'yi tıklayın.

TTS çıkışınızın .mp3 dosyasını kaydetmek için indir düğmesini de tıklayabilirsiniz.

SSML (Dialogflow)

SSML'deki URL'ler

SSML öğeleri için destek

`<speak>`

Örnek

`<break>`

Özellikler

Örnek

`<say‑as>`

Örnekler

`<audio>`

Özellikler

Örnek

`<p>,<s>`

Örnek

En iyi uygulamalar

`<sub>`

Örnekler

`<mark>`

Örnek

`<prosody>`

Örnek

`<emphasis>`

Örnek

`<par>`

Örnek

`<seq>`

Örnek

`<media>`

Özellikler

Zaman belirtimi

TTS simülasyon aracı