1. April 2024
OpenAI entwickelt KI für synthetische Stimmen
OpenAI hat ein KI-Tool vorgestellt, das wohl menschliche Stimmen anhand einer kurzen Audiovorlage perfekt nachahmen kann. Das Unternehmen weist selbst auf das hohe Missbrauchspotenzial hin.

OpenAI stellt mit Voice Engine ein neues Modell vor, das auf Basis von Texteingaben und einem kurzen Audiobeispiel realistische, dem Sprecher ähnliche Stimmen generieren kann. Die Technologie befindet sich noch in einem frühen Entwicklungsstadium. Testergebnisse waren vielversprechend und zeigten, dass die Technologie wohl für verschiedene Anwendungsbereiche geeignet ist.
Die Engine nutzt neuronale Netze, um die Sprachmerkmale des Sprechers aus einem 15-sekündigen Audio-Sample zu extrahieren. Die Merkmale werden dann verwendet, um synthetische Sprache zu erzeugen, die dem Original in Tonhöhe, Sprechtempo und sogar emotionaler Ausdruckskraft sehr ähnlich ist. Das Modell soll auch in der Lage sein, verschiedene Sprechertypen und Dialekte nachzuahmen.
Vorsichtiger Ansatz und Dialogbereitschaft
OpenAI ist sich der Brisanz des Projektes und des Missbrauchspotenzials wohl bewusst. Es verfolgt nach eigenen Angaben einen vorsichtigen Ansatz bei der Entwicklung und Veröffentlichung von Voice Engine und möchte einen breiten Dialog über den verantwortungsvollen Einsatz dieser Technologie anstoßen. Wir sind sehr gespannt, wie es weitergeht mit der Voice Engine!