it-swarm.com.de

Was sind Sprachcodes in der Chrome-Implementierung der HTML5-Spracherkennungs-API?

Chrome hat die HTML5-Spracherkennungs-API implementiert. Viele Sprachen werden unterstützt. Ich möchte wissen, welche Sprachen unterstützt werden, und der entsprechende Code jeder Sprache, der im lang-Attribut des HTML-Elements verwendet wird.

Zum Beispiel:

  • Polnisch (pl-PL)
  • Türkisch (tr-TR)

Vielen Dank!

27
weilou

Ok, wenn es nicht veröffentlicht wird, können wir versuchen, dies zumindest herauszufinden. Lasst mich diese Tabelle an den Anfang stellen und wir werden sie verfeinern, wenn jemand mehr Informationen hat.

Ich gehe davon aus, dass die unterstützten Sprachen den von der Sprachsuche unterstützten Sprachen ähnlich sein sollten und Google Standard-Sprachcodes verwendet und dies in allen Diensten konsistent durchführt.

Ich habe nach Sprachen gesucht, die von der Sprachsuche in wikipedia unterstützt werden.

Ich habe Sprachcodes hier gefunden, auf der Seite Google-Spracheinstellungen und hier

EDIT: Ich habe mit dem Backend-Spracherkennungsdienst experimentiert. Ich habe eine Reihe von Tests durchgeführt, bei denen ich die gleiche englische Sprachprobe an die API übergeben habe, aber jedes Mal einen anderen Dialekt angegeben habe. Es sieht aus wie:

  • Wenn eine Sprache nicht unterstützt wird, wird die Erkennung auf en-US zurückgesetzt (es sieht so aus, als ob das Beispiel in Englisch ist).
  • Wenn ein Dialekt nicht unterstützt wird (oder nicht vorhanden ist), wird die Erkennung in einigen Fällen auf den Hauptdialekt oder auf en-US zurückgesetzt
  • Hauptdialekt kann nur als erster Teil des Bezeichners angegeben werden. 'En-US' und 'en' liefern also die gleichen Ergebnisse.
  • Die Anerkennung für einige Sprachen, wie Chinesisch und Japanisch, führt zu Ergebnissen in Englisch. Anders als in den USA ist dies jedoch seltsam. Wahrscheinlich unterscheidet sich das Muster sehr stark von Chinesisch und der Service ist klug, das herauszufinden.

Ich behandle einen Dialekt als unterstützt, wenn die Erkennung zu einem anderen Ergebnis als der Sprache EN-US und dem Haupt-Dialekt führt. Um dies jedoch zu 100% zu überprüfen, müssen wir für jede Sprache Beispiele ausführen.

Legende

  • + Vor allem unterstützt, da test ein von en-US und Hauptdialekt abweichendes Ergebnis liefert.
  • .+ Ist auf Wikipedia nicht vorhanden, wird aber vor allem unterstützt, da der Test Ergebnisse liefert, die sich von en-US und dem Hauptdialekt unterscheiden.
  • +? Vor allem unterstützt, da es auf Wikipedia aufgeführt ist. Der Test meines Beispiels ergibt jedoch ein identisches Ergebnis wie der Hauptdialekt. Entweder ist dies ein Zufall, oder der Sprachcode ist falsch.
  • .+? Nicht auf Wikipedia gelistet, sieht aber wie unterstützt aus, da test Ergebnisse zu den Ergebnissen von en-US und Hauptdialekt führen.Sprachen.

  • + Baskisch eu
  • + bulgarisch bg
  • + Katalanisch ca
  • + Arabisch (Ägypten) ar-EG
  • + Arabisch (Jordanien) ar-JO
  • +? Arabisch (Kuwait) ar-KW
  • + Arabisch (Libanon) ar-LB
  • +? Arabisch (Katar) ar-QA
  • + Arabisch (VAE) ar-AE
  • + Arabisch (Marokko) ar-MA
  • .+ Arabisch (Irak) ar-IQ
  • .+ Arabisch (Algerien) ar-DZ
  • .+ Arabisch (Bahrain) ar-BH
  • .+ Arabisch (Libyen) ar-LY
  • .+ Arabisch (Oman) ar-OM
  • .+ Arabisch (Saudi-Arabien) ar-SA
  • .+ Arabisch (Tunesien) ar-TN
  • .+ Arabisch (Jemen) ar-YE
  • .+ Tschechisch cs
  • + niederländisch nl-NL
  • + Englisch (Australien) de-DE
  • + Englisch (Kanada) de-CA
  • +? Englisch (Indien) de-IN
  • + Englisch (Neuseeland) de-NZ
  • + Englisch (Südafrika) de-ZA
  • + Englisch (UK) de-DE
  • + Englisch (US) de-DE
  • + finnisch fi
  • + Französisch fr-FR
  • + Galizisch gl
  • + deutsch de-DE
  • + hebräisch er
  • + ungarisch hu
  • + Isländisch ist
  • + italienisch it-IT
  • + Indonesisch id
  • + japanisch ja
  • + Koreanisch ko
  • + Latein la
  • + Mandarin-Chinesisch zh-CN
  • + traditionelles Taiwan zh-TW
  • + Vereinfachtes China zh-CN?
  • +? Vereinfachtes Hongkong zh-HK
  • + Yue Chinese (traditionelles Hongkong) zh-yue
  • + Malaysisch ms-MY
  • + norwegisch nein-nein
  • + Polnisch pl
  • + Pig Latin xx-piglatin
  • +? Portugiesisch pt-PT
  • + Portugiesisch (Brasilien) pt-BR
  • .+ Rumänisch ro-RO
  • + russisch ru
  • + Serbisch sr-SP
  • + Slowakisch sk
  • + Spanisch (Argentinien) es-AR
  • + Spanisch (Bolivien) es-BO
  • + Spanisch (Chile) es-CL
  • +? Spanisch (Kolumbien) es-CO
  • +? spanisch (Costa Rica) es-CR
  • +? spanisch (Dominikanische Republik) es-DO
  • + Spanisch (Ecuador) es-EC
  • + spanisch (El Salvador) es-SV
  • + Spanisch (Guatemala) es-GT
  • + spanisch (Honduras) es-HN
  • + Spanisch (Mexiko) es-MX
  • + spanisch (Nicaragua) es-NI
  • + Spanisch (Panama) es-PA
  • + Spanisch (Paraguay) es-PY
  • + Spanisch (Peru) es-PE
  • + spanisch (Puerto Rico) es-PR
  • + Spanisch (Spanien) es-ES
  • + spanisch (US) es-US
  • + Spanisch (Uruguay) es-UY
  • + spanisch (Venezuela) es-VE
  • + Schwedisch sv-SE
  • + Türkisch tr
  • + Zulu zu
  • + Zulu zu
47
Sergey Zyuzin

Ich weiß, dass dies ein alter Beitrag ist, aber da diese Informationen ärgerlich schwer zu finden sind, dachte ich, ich würde eine Liste für jeden veröffentlichen, der suchen könnte. Bitte hinterlassen Sie eine Notiz, wenn Sie Fehler oder Auslassungen feststellen. 

{
  "Afrikaans": [
    ["South Africa", "af-ZA"]
  ],
  "Arabic" : [
    ["Algeria","ar-DZ"],
    ["Bahrain","ar-BH"],
    ["Egypt","ar-EG"],
    ["Israel","ar-IL"],
    ["Iraq","ar-IQ"],
    ["Jordan","ar-JO"],
    ["Kuwait","ar-KW"],
    ["Lebanon","ar-LB"],
    ["Morocco","ar-MA"],
    ["Oman","ar-OM"],
    ["Palestinian Territory","ar-PS"],
    ["Qatar","ar-QA"],
    ["Saudi Arabia","ar-SA"],
    ["Tunisia","ar-TN"],
    ["UAE","ar-AE"]
  ],
  "Basque": [
    ["Spain", "eu-ES"]
  ],
  "Bulgarian": [
    ["Bulgaria", "bg-BG"]
  ],
  "Catalan": [
    ["Spain", "ca-ES"]
  ],
  "Chinese Mandarin": [
    ["China (Simp.)", "cmn-Hans-CN"],
    ["Hong Kong SAR (Trad.)", "cmn-Hans-HK"],
    ["Taiwan (Trad.)", "cmn-Hant-TW"]
  ],
  "Chinese Cantonese": [
    ["Hong Kong", "yue-Hant-HK"]
  ],
  "Croatian": [
    ["Croatia", "hr_HR"]
  ],
  "Czech": [
    ["Czech Republic", "cs-CZ"]
  ],
  "Danish": [
    ["Denmark", "da-DK"]
  ],
  "English": [
    ["Australia", "en-AU"],
    ["Canada", "en-CA"],
    ["India", "en-IN"],
    ["Ireland", "en-IE"],
    ["New Zealand", "en-NZ"],
    ["Philippines", "en-PH"],
    ["South Africa", "en-ZA"],
    ["United Kingdom", "en-GB"],
    ["United States", "en-US"]
  ],
  "Farsi": [
    ["Iran", "fa-IR"]
  ],
  "French": [
    ["France", "fr-FR"]
  ],
  "Filipino": [
    ["Philippines", "fil-PH"]
  ],
  "Galician": [
    ["Spain", "gl-ES"]
  ],
  "German": [
    ["Germany", "de-DE"]
  ],
  "Greek": [
    ["Greece", "el-GR"]
  ],
  "Finnish": [
    ["Finland", "fi-FI"]
  ],
  "Hebrew" :[
    ["Israel", "he-IL"]
  ],
  "Hindi": [
    ["India", "hi-IN"]
  ],
  "Hungarian": [
    ["Hungary", "hu-HU"]
  ],
  "Indonesian": [
    ["Indonesia", "id-ID"]
  ],
  "Icelandic": [
    ["Iceland", "is-IS"]
  ],
  "Italian": [
    ["Italy", "it-IT"],
    ["Switzerland", "it-CH"]
  ],
  "Japanese": [
    ["Japan", "ja-JP"]
  ],
  "Korean": [
    ["Korea", "ko-KR"]
  ],
  "Lithuanian": [
    ["Lithuania", "lt-LT"]
  ],
  "Malaysian": [
    ["Malaysia", "ms-MY"]
  ],
  "Dutch": [
    ["Netherlands", "nl-NL"]
  ],
  "Norwegian": [
    ["Norway", "nb-NO"]
  ],
  "Polish": [
    ["Poland", "pl-PL"]
  ],
  "Portuguese": [
    ["Brazil", "pt-BR"],
    ["Portugal", "pt-PT"]
  ],
  "Romanian": [
    ["Romania", "ro-RO"]
  ],
  "Russian": [
    ["Russia", "ru-RU"]
  ],
  "Serbian": [
    ["Serbia", "sr-RS"]
  ],
  "Slovak": [
    ["Slovakia", "sk-SK"]
  ],
  "Slovenian": [
    ["Slovenia", "sl-SI"]
  ],
  "Spanish": [
    ["Argentina", "es-AR"],
    ["Bolivia", "es-BO"],
    ["Chile", "es-CL"],
    ["Colombia", "es-CO"],
    ["Costa Rica", "es-CR"],
    ["Dominican Republic", "es-DO"],
    ["Ecuador", "es-EC"],
    ["El Salvador", "es-SV"],
    ["Guatemala", "es-GT"],
    ["Honduras", "es-HN"],
    ["México", "es-MX"],
    ["Nicaragua", "es-NI"],
    ["Panamá", "es-PA"],
    ["Paraguay", "es-PY"],
    ["Perú", "es-PE"],
    ["Puerto Rico", "es-PR"],
    ["Spain", "es-ES"],
    ["Uruguay", "es-UY"],
    ["United States", "es-US"],
    ["Venezuela", "es-VE"]
  ],
  "Swedish": [
    ["Sweden", "sv-SE"]
  ],
  "Thai": [
    ["Thailand", "th-TH"]
  ],
  "Turkish": [
    ["Turkey", "tr-TR"]
  ],
  "Ukrainian": [
    ["Ukraine", "uk-UA"]
  ],
  "Vietnamese": [
    ["Viet Nam", "vi-VN"]
  ],
  "Zulu": [
    ["South Africa", "zu-ZA"]
  ]
}

Bearbeiten: Ich habe auch diese Liste gefunden, die wahrscheinlich aktueller ist: https://cloud.google.com/speech-to-text/docs/languages ​​

8
TimHayes

Verwenden Sie den folgenden Code, um alle verfügbaren Stimmen für die Sprach-API in Ihrem Browser abzurufen:

var voices = speechSynthesis.getVoices();
      for(var i = 0; i < voices.length; i++ ) {
        console.log("Voice " + i.toString() + ' ' + voices[i].name + ' ' + voices[i].uri);
      }

Derzeit unterstützen nur Chrome und Safari die Web Speech-API (obwohl Safari nur die Text-zu-Sprache-Funktionalität unterstützt). Merkwürdigerweise unterstützt Firefox OS TTS, die Browserversion jedoch nicht.

Die Liste der Sprachen hängt davon ab, in welchem ​​Browser Sie sich befinden, sowohl in der Dokumentation als auch in meinen Tests (abhängig vom Benutzeragenten).

In Safari stehen Ihnen auch viele Sprachen zur Verfügung (ich glaube über 40). In Chrome erhalten Sie zu diesem Zeitpunkt die folgende Liste:

Voice 0 Google US-Englisch undefined

Voice 1 Google UK English Male undefined

Voice 2 Google UK English Female undefined

Voice 3 Google Español undefined

Voice 4 Google Français undefined

Voice 5 Google Italiano undefined

Voice 6 Google Deutsch undefined

Voice 7 Google 日本人 undefiniert

Voice 8 Google 의 의 undefiniert

Voice 9 Google und 的 undefined

Voice 10 native undefined

4
mesosteros

Hier haben Sie @TimHayes in einer LinkedHashMap, wo Sie die Werte abrufen können. Ich verwende LinkedHashMap, damit ich die Position der Karte ermitteln kann.

    LinkedHashMap<String,String> country = new LinkedHashMap<String,String>();


    country.put("South Africa", "af-ZA");
    country.put("Algeria", "ar-DZ");
    country.put("Bahrain", "ar-BH");
    country.put("Egypt", "ar-EG");
    country.put("Israel", "ar-IL");
    country.put("Iraq", "ar-IQ");
    country.put("Jordan", "ar-JO");
    country.put("Kuwait", "ar-KW");
    country.put("Lebanon", "ar-LB");
    country.put("Morocco", "ar-MA");
    country.put("Oman", "ar-OM");
    country.put("Palestinian Territory", "ar-PS");
    country.put("Qatar", "ar-QA");
    country.put("Saudi Arabia", "ar-SA");
    country.put("Tunisia", "ar-TN");
    country.put("UAE", "ar-AE");
    country.put("Spain", "eu-ES");
    country.put("Bulgaria", "bg-BG");
    country.put("Spain", "ca-ES");
    country.put("China (Simp.)", "cmn-Hans-CN");
    country.put("Hong Kong SAR (Trad.)", "cmn-Hans-HK");
    country.put("Taiwan (Trad.)", "cmn-Hant-TW");
    country.put("Hong Kong", "yue-Hant-HK");
    country.put("Croatia", "hr_HR");
    country.put("Czech Republic", "cs-CZ");
    country.put("Denmark", "da-DK");
    country.put("Australia", "en-AU");
    country.put("Canada", "en-CA");
    country.put("India", "en-IN");
    country.put("Ireland", "en-IE");
    country.put("New Zealand", "en-NZ");
    country.put("Philippines", "en-PH");
    country.put("South Africa", "en-ZA");
    country.put("United Kingdom", "en-GB");
    country.put("United States", "en-US");
    country.put("Iran", "fa-IR");
    country.put("France", "fr-FR");
    country.put("Philippines", "fil-PH");
    country.put("Spain", "gl-ES");
    country.put("Germany", "de-DE");
    country.put("Greece", "el-GR");
    country.put("Finland", "fi-FI");
    country.put("Israel", "he-IL");
    country.put("India", "hi-IN");
    country.put("Hungary", "hu-HU");
    country.put("Indonesia", "id-ID");
    country.put("Iceland", "is-IS");
    country.put("Italy", "it-IT");
    country.put("Switzerland", "it-CH");
    country.put("Japan", "ja-JP");
    country.put("Korea", "ko-KR");
    country.put("Lithuania", "lt-LT");
    country.put("Malaysia", "ms-MY");
    country.put("Netherlands", "nl-NL");
    country.put("Norway", "nb-NO");
    country.put("Poland", "pl-PL");
    country.put("Brazil", "pt-BR");
    country.put("Portugal", "pt-PT");
    country.put("Romania", "ro-RO");
    country.put("Russia", "ru-RU");
    country.put("Serbia", "sr-RS");
    country.put("Slovakia", "sk-SK");
    country.put("Slovenia", "sl-SI");
    country.put("Argentina", "es-AR");
    country.put("Bolivia", "es-BO");
    country.put("Chile", "es-CL");
    country.put("Colombia", "es-CO");
    country.put("Costa Rica", "es-CR");
    country.put("Dominican Republic", "es-DO");
    country.put("Ecuador", "es-EC");
    country.put("El Salvador", "es-SV");
    country.put("Guatemala", "es-GT");
    country.put("Honduras", "es-HN");
    country.put("México", "es-MX");
    country.put("Nicaragua", "es-NI");
    country.put("Panamá", "es-PA");
    country.put("Paraguay", "es-PY");
    country.put("Perú", "es-PE");
    country.put("Puerto Rico", "es-PR");
    country.put("Spain", "es-ES");
    country.put("Uruguay", "es-UY");
    country.put("United States", "es-US");
    country.put("Venezuela", "es-VE");
    country.put("Sweden", "sv-SE");
    country.put("Thailand", "th-TH");
    country.put("Turkey", "tr-TR");
    country.put("Ukraine", "uk-UA");
    country.put("Viet Nam", "vi-VN");
    country.put("South Africa", "zu-ZA");
0
Waffles.Inc