Lautstärke

LUFS (Loudness Units relatives to Full Scale) ist ein Standard, der die Volumennormalisierung in vielen Genres und Produktionsstilen ermöglicht. LUFS ist ein komplizierter Algorithmus, der auf der wahrgenommenen Lautstärke des menschlichen Gehörs bei einer angenehmen Hörlautstärke basiert. Audioproduzenten können damit Änderungen der Amplitude vermeiden, bei denen die Nutzer die Lautstärke ständig anpassen müssen. LUFS wird auch als LKFS (Lautheit, K-gewichtet, relativ zu Full Scale) bezeichnet.

Bei der Wiedergabe von Audiodateien mit SSML sollte die durchschnittliche Lautstärke für Stereo-Audioinhalte -16 LUFS (Loudness Units Full Scale) betragen, was der durchschnittlichen Lautstärke der Sprachausgabe von Google Assistant entspricht. Diese Stufe sorgt für ein ausgewogenes Verhältnis zwischen der allgemeinen Lautstärkeregelung des sprachgesteuerten Lautsprechers und genügend Toleranzbereich für Materialien mit einem variablen Dynamikbereich im Vergleich zu Google Assistant.

Bei Mono-Audioinhalten sollte die durchschnittliche Lautstärke -19 LUFS anstelle von -16 LUFS betragen. Das Lautstärkeziel für Mono-Audioinhalte unterscheidet sich von dem für Stereo-Audioinhalte, da bei der Umwandlung von Mono-Audioinhalten in Stereo die Mono-Audiospur auf beiden Kanälen eines Stereosignals dupliziert wird.Dadurch wird die Energie des Signals verdoppelt, was einem Anstieg der LUFS-Messung von 3,01 Lautheitseinheiten (LU) entspricht. Wenn umgekehrt ein Stereosignal für die Wiedergabe auf einem einzelnen Lautsprecher in Mono umgewandelt wird, wird das Monosignal in der Regel durch Mittelwertung des Signals aus jedem Kanal erzeugt.Diese Transformation verringert die LUFS-Messung um genau den gleichen Wert, nämlich 3,01 LU. Daher sind die Lautstärkemessungen für Mono- und Stereoinhalte nicht direkt vergleichbar, müssen aber um 3,01 LUFS verschoben werden.

Bei einigen Lautheitsmessern gibt es Optionen zur Korrektur dieser Diskrepanz. Wenn Sie beispielsweise ffmpeg (siehe unten) verwenden, können Sie die Option dual_mono (oder dualmono) wie unten empfohlen verwenden. Wenn Sie ein Lautstärkemessgerät mit einer solchen Option verwenden und diese Option aktiviert haben, sollte das Lautstärkeziel -16 LUFS betragen, unabhängig davon, ob der Inhalt Stereo oder Mono ist.

Wir empfehlen zwei Optionen zum Messen und Anpassen der Lautstärke:

DAW- und LUFS-Messtool verwenden

In den folgenden Schritten wird beschrieben, wie Sie dafür sorgen, dass Ihre Audiodaten der Empfehlung -16 LUFS entsprechen:

  1. Erstellen Sie alle Audiodaten über die gesamte Audiodauer mit konstant laut und ausbalancierten Pegeln, damit es keine Spitzen oder Einbrüche bei der Lautstärke gibt.
  2. Richten Sie eine Digital Audio Workstation (DAW) und ein LUFS-Messtool ein, um die Audiolautstärke im Vergleich mit der Google TTS Loudness Reference zu messen.
  3. Messen und passen Sie die Lautstärke Ihrer Audiodaten so an, dass sie eine integrierte durchschnittliche Lautstärke von etwa -16 LUFS (oder -19 LUFS bei Monoinhalten) haben.
  4. Prüfen Sie Ihre Audioqualität, indem Sie die Lautstärke mit der Lautstärkereferenz für Sprachausgabe von Google TTS vergleichen.

DAW- und LUFS-Messtool einrichten

Es gibt viele DAWs und LUFS-Messtools als Freeware und kommerzielle Produkte. Wenn Sie bereits ein bevorzugtes DAW- und LUFS-Messtool haben, können Sie dieses verwenden. Andernfalls empfehlen wir Audacity für Windows und Linux oder Reaper für Mac für DAWs und TBProAudio dpMeter II für ein LUFS-Messtool. In den folgenden Abschnitten wird davon ausgegangen, dass Sie diese Tools verwenden.

Dateien abrufen

  1. Laden Sie eine DAW herunter und installieren Sie sie:
  2. Laden Sie dpMeter II für Ihr Betriebssystem herunter und installieren Sie es. Dieses Tool funktioniert sowohl mit Audacity als auch mit Reaper als VST-Plug-in (Virtual Studio Technology).
  3. Laden Sie die Audiodatei Google TTS Loudness Reference herunter. Die TTS-Audioausgabe lautet: „Die integrierte Lautstärke dieses Satzes beträgt etwa -16 LUFS“. Diese Datei dient als Testaudio für das Messgerät sowie als Referenz für den Gehörschutz.

dpMeter II für Audacity (Windows/Linux) konfigurieren

  1. Öffnen Sie die Audiodatei der Google Sprachausgabe in Audacity.
  2. Öffnen Sie das dpMeter II-Plug-in. Klicken Sie dazu auf den Tab Effekt und wählen Sie Plug-ins hinzufügen/entfernen aus.
  3. Suchen Sie in der Liste nach dpMeter2, klicken Sie auf Aktivieren und dann auf OK. Das dpMeter II-Plug-in wird jetzt im Drop-down-Menü Effect angezeigt.
  4. Klicken Sie im Drop-down-Menü Effekt auf dpMeter2, um das Plug-in zu öffnen. dpMeter II verwendet standardmäßig den RMS-Modus (orangefarbenes Farbschema). Ändern Sie den Modus in EBU r128 (blaues Farbschema), um LUFS zu messen.

dpMeter II für Reaper (Mac) konfigurieren

  1. Öffnen Sie die Google TTS-Referenz zur Lautstärke. Klicken Sie dazu auf Einfügen > Mediendatei....
  2. Öffnen Sie das dpMeter II-Plug-in, indem Sie im linken Bereich der Audioebene auf die grüne FX-Schaltfläche (1 in der Abbildung) klicken. Das Fenster FX wird angezeigt.

  3. Klicken Sie in der Liste auf dpMeter2. dpMeter II ist standardmäßig im RMS-Modus (orangefarbenes Farbschema) verfügbar. Ändern Sie den Modus in EBU r128 (blaues Farbschema), um LUFS zu messen.

Lautstärke messen und anpassen

Unterschiedliche Messgeräte in verschiedenen DAWs geben etwas unterschiedliche Werte an. Audacity misst die Google TTS-Referenz für Lautstärke mit -15,1 LUFS tendenziell etwas lauter als andere DAWs, während Reaper einen Messwert von -16,0 LUFS liefert. Wenn die DAW die Lautstärke der Google TTS-Lautheitsreferenz auf +/-2 LUFS von -16 misst, sollte es für die Einstellung der Audiolautstärke geeignet sein.

So messen und passen Sie die Lautstärke an:

  1. Verwenden Sie dpMeter II, um die Lautstärke der Google Sprachausgabe zu messen und einen LUFS-Basiswert festzulegen. Wenn die DAW einen höheren oder niedrigeren als -16 LUFS für den Google TTS-Lautheitsgrad misst, gleichen Sie den Ton mit dem Normalbereich Ihrer DAW ab. In Audacity misst beispielsweise dpMeter II eine integrierte Lautstärke von -15,1 LUFS. Die neue Ziellautstärke für Ihr Programm sollte also -15,1 LUFS betragen.
  2. Nachdem Sie eine Referenz festgelegt haben, passen Sie Ihr Audio an den Referenzwert an.

Referenz zur Lautstärke für Sprachausgabe bei Google messen

Klicken Sie auf die grüne Wiedergabeschaltfläche im dpMeter II oder auf die Wiedergabetaste (Leertaste) in Ihrer DAW (Punkt 4 unten), um die Lautstärke der Datei zu messen.

In der folgenden Liste werden die wichtigsten Funktionen beschrieben, die Sie in dpMeter II verwenden können:

  1. Modus: Auf EBU (anstelle von RMS) festlegen, um die Lautstärke in LUFS zu messen
  2. Verstärkungsregelung: Diese Einstellung muss auf 0,0 eingestellt sein, bis Sie die Lautstärke Ihres Programms ändern können.
  3. Integrierte Lautstärke: Gibt die durchschnittliche Lautstärke aller Audioinhalte an, die das Plug-in seit dem Klick auf die Taste zum Zurücksetzen (5) analysiert hat. Klicken Sie vor jeder Lautheitsmessung auf die Schaltfläche zum Zurücksetzen (5), um sicherzustellen, dass Sie nur die Lautstärke der aktuellen Auswahl messen.
  4. Wiedergeben: Dadurch wird die Lautheitsanalyse der Audiodatei gestartet. Diese Schaltfläche ist nicht in allen DAWs zu sehen. Ein Klick auf die Hauptwiedergabeschaltfläche (Leertaste) in deiner DAW sollte denselben Effekt haben.)
  5. Zurücksetzen: Klicken Sie zwischen den einzelnen Lautstärkemessungen auf diese Schaltfläche.
  6. Apply (Anwenden): Wenn Sie die Lautstärke Ihres Programmmaterials an die Google TTS-Lautheitsreferenz anpassen möchten, wendet diese Schaltfläche die mit der Verstärkungsregelung (2) eingestellte Lautstärkeänderung an.

Lautstärke an die Google Sprachausgabe anpassen

Nachdem du nun die Lautstärke der Google TTS-Referenz für die Sprachausgabe gemessen hast, kannst du die Lautstärke deiner Audioinhalte messen und anpassen:

  1. Öffnen Sie die Audiodatei und wählen Sie im Menü Effekt die Option dpMeter2 aus.
  2. Klicken Sie auf die Schaltfläche Wiedergabe und passen Sie den integrierten Lautstärkewert auf einen Durchschnittswert für die Audiodatei an.
  3. Wenn sich die integrierte Lautstärke von der Lautstärkereferenz von Google für Sprachausgabe unterscheidet, passen Sie die Audioverstärkung an die Referenz an. Wenn Ihr Audio beispielsweise bei einer integrierten Lautstärke von -12 misst, ist es zu laut. Verringern Sie die Verstärkung. Setzen Sie dazu die Verstärkungsregelung auf -4db und klicken Sie auf Anwenden. Dadurch wird der Zielbereich der Google Sprachausgabe (-16 LUFS) eingestellt. Möglicherweise müssen Sie die Verstärkung messen und anpassen, um die Ziellautstärke zu erreichen, da der Verstärkung nur den LUFS-Wert entspricht.

ffmpeg verwenden

FFmpeg ist ein Medien-Framework mit einem Befehlszeilentool für die Medienkonvertierung. Das Tool enthält einen Filter namens loudnorm zur Normalisierung der Lautstärke. Sie können „lautnorm“ verwenden, um im Dual-Pass-Modus eine Version Ihrer Audiodatei mit der entsprechenden Lautstärke von -16 LUFS auszugeben.

  1. Lade FFmpeg herunter und installiere es.
  2. Gehen Sie zum Installationsverzeichnis und führen Sie FFmpeg mit dem "lautnorm"-Filter für Ihre Eingabedatei aus. Achten Sie darauf, dass die Option dual_mono aktiviert ist.

    ./ffmpeg -i /path/to/input.wav \
        -af loudnorm=I=-16:dual_mono=true:TP=-1.5:LRA=11:print_format=summary \
        -f null -
    

    Damit wird FFmpeg angewiesen, die Audiowerte Ihrer Mediendatei zu messen, ohne eine Ausgabedatei zu erstellen. Sie erhalten eine Reihe von Werten, die so dargestellt sind:

    Input Integrated:    -27.2 LUFS
    Input True Peak:     -14.4 dBTP
    Input LRA:             0.1 LU
    Input Threshold:     -37.7 LUFS
    
    Output Integrated:   -15.5 LUFS
    Output True Peak:     -2.7 dBTP
    Output LRA:            0.0 LU
    Output Threshold:    -26.2 LUFS
    
    Normalization Type:   Dynamic
    Target Offset:        -0.5 LU
    

    Die obigen Beispielwerte geben wichtige Informationen zu den eingehenden Medien an. Der angezeigte Wert Input Integrated gibt beispielsweise an, dass der Ton zu laut ist. Der Wert für Output Integrated liegt viel näher bei -16,0. Die Werte für Input True Peak und Input LRA (Lautstärkebereich) sind höher als die angegebenen Obergrenzen und werden in der normalisierten Version reduziert. Schließlich steht Target Offset für den in der Ausgabe verwendeten Offset-Verstärkung.

  3. Führen Sie einen zweiten Durchlauf des "lautnorm"-Filters aus und geben Sie die Werte aus Schritt 1 als "gemessene" Werte in den "lautnorm"-Optionen an.

    ./ffmpeg -i /path/to/input.wav -af loudnorm=I=-16:TP=-1.5:LRA=11:measured_I=-27.2:measured_TP=-14.4:measured_LRA=0.1:measured_thresh=-37.7:offset=-0.5:linear=true:print_format=summary output.wav
    

    Es wird eine Datei mit dem Namen output.wav erstellt, die eine laute normalisierte Version der Eingabedatei enthält.

Hören Sie sich die folgenden Beispiele für eine Audiodatei vor und nach der ffmpeg-Normalisierung der Lautstärke an, um zu erfahren, wie das Tool funktioniert.

Vorher

Nachher

Kopfhörer prüfen

Prüfen Sie, ob Ihr Audio im Vergleich zur Lautstärkereferenz von Google für Sprachausgabe gut klingt. Wechseln Sie dazu zwischen dem Anhören der Dateien und beobachten Sie Schwankungen bei Lautstärke oder Balance und passen Sie die Verstärkung bei Bedarf per Ohr an.

Die Lautstärke sollte bei -16 LUFS (Stereo) oder -19 LUFS (Mono) einheitlich klingen. Wenn der Frequenzbereich Ihrer Audiodaten jedoch zu hoch (wie Vogelgezwitscher) oder zu niedrig (wie Donner) ist, kann ein Wert von -16 LUFS (Stereo) oder -19 LUFS (Mono) dazu führen, dass dieser Audioklang nicht mit der Lautstärkereferenz von Google TTS übereinstimmt. In diesem Fall ist ein Hörtest besonders hilfreich, um alle Audioelemente in deinem Programm auszugleichen.