it-swarm.com.de

Was ist die Google Cloud API für TTS (Text to Speech)?

In meiner Webanwendung versuche ich, eine HTTP-Anfrage an eine Google-API zu senden, die Text (z. B. "Hello World") entgegennimmt und eine MP3-Datei mit dem entsprechenden Sprachausgabewert zurückgibt.

Ich habe diese Frage gesehen: Google Text to Speech tts api scheint nicht zu funktionieren . Und diese Google-Seite: https://cloud.google.com/translate/docs/ .

Und es gibt viele andere Seiten, die veraltet zu sein scheinen - es sieht so aus, als ob diese Funktion von Google entfernt wurde oder sich in einem anderen Ruhezustand befindet?

Ich sehe keine Dokumentation (wie in der Google Übersetzer-API https://cloud.google.com/translate/ ) zum Aufrufen der Google API für TTS. Ich habe ein Google Cloud API-Konto und einen Schlüssel.

Danke, Dan

6
Dan

Google Text-to-Speech ist ein Bildschirmleser application , der auf der Android-Plattform entwickelt wurde und verfügbar ist. Derzeit ist er nicht als Teil der Google Cloud Platform verfügbar.

Andererseits ist Google Translate zwischen einer Website Add-On und einer webbasierten Anwendung aufgeteilt, die über eine Funktion namens "Listen" verfügt. Mit dieser Funktion kann die Ausgabe der Übersetzung über audito abgespielt werden. Derzeit ist es jedoch nicht möglich, sie im MP3-Format herunterzuladen.

Es ist wichtig, die Cloud-Übersetzung API nicht zu verwechseln, die als Teil der Cloud-Plattform verfügbar ist und dazu dient, text-based-Eingaben von einer unterstützten language in eine andere zu übersetzen.

Wenn Sie daran interessiert sind, dass diese Art von API als Teil der Google Cloud-Plattform verfügbar ist, können Sie ein neues Problem mit der Funktionsanforderung zu diesem Google Public Issue Tracker senden.

6
Alex

Google hat gerade die Cloud-Text-zu-Sprache-API gestartet.

5

Google hat kürzlich veröffentlicht Google Cloud Text To Speech API.

.NET Die Clientversion von Google.Cloud.TextToSpeech finden Sie hier: https://github.com/jhabjan/Google.Cloud.TextToSpeech.V1

Hier ein kurzes Beispiel zur Verwendung des Clients:

GoogleCredential credentials =
    GoogleCredential.FromFile(Path.Combine(Program.AppPath, "jhabjan-test-47a56894d458.json"));

TextToSpeechClient client = TextToSpeechClient.Create(credentials);

SynthesizeSpeechResponse response = client.SynthesizeSpeech(
    new SynthesisInput()
    {
        Text = "Google Cloud Text-to-Speech enables developers to synthesize natural-sounding speech with 32 voices"
    },
    new VoiceSelectionParams()
    {
        LanguageCode = "en-US",
        Name = "en-US-Wavenet-C"
    },
    new AudioConfig()
    {
        AudioEncoding = AudioEncoding.Mp3
    }
);

string speechFile = Path.Combine(Directory.GetCurrentDirectory(), "sample.mp3");

File.WriteAllBytes(speechFile, response.AudioContent);
1
HABJAN