Weniger als 100 Zeilen Code sind für eine erste Erkennungs- und Synthese-Applikation notwendig.
Dabei bleibt das SDK voll konfigurierbar.
» Offline
» Einfach programmieren
» Schnell implementieren
» Hochflexibel konfigurieren
» Freitexterkennung
» Mehrere Instanzen parallel
» Nutzung multipler CPU-Kerne
» 65 verschiedene Sprachen
» 145 multilinguale Stimmen
» Basierend auf Java
» Für Linux, Windows, ARM-CPU

Text-To-Speech (TTS)
» Multilingual
» 65 Sprachen
» 145 Stimmen (male/female)
» Klartext oder SSML-Format möglich
Automatic Speech Recognition (ASR)
» Voll ereignisgesteuert
» Grammatikbasiert
» „Barge-In“
» Gilded-Speech
» Geringe Sprachverzögerung (Realtime Factor 4,6%)
» Unterstützt neue Akustik Modelle (AcMod 6+)
Use Case Beispiele
Schlüsselworterkennung
System:
“Welches Restaurant soll ich für Sie suchen?”
Nutzer:
“Hmm, ich habe heute Lust auf Chinesisch”
Multilinguale Sprachmodelle
Nutzer:
“Spiele ‚Clair de Lune‘ von Claude Debussy”