-
Das Voice Interface für den unkomplizierten Zugang zu fortschrittlichen Sprachtechnologien!
Ohne Ihnen Grenzen zu setzen, vereinfacht semvox.vi den Zugang zur Modalität "Sprache"
durch die Bereitstellung einer generischen API - in Ihrer bevorzugten Programmiersprache, auf verschiedenen Plattformen und mit ASR- und TTS-Technologien fortschrittlichster Anbieter.
» Einfache Integration von Sprachtechnologien
» ASR & TTS offline und embedded auf dem Device
» Generische Schnittstelle zu verschiedenen ASR- und TTS-Anbietern
» Lauffähig auf verschiedenen Systemen: Linux, Windows, Android, weitere*
» Native und effiziente Implementierung in C
» Anbindung von Java, C#, C, weitere*
» Erleichterter Einstieg durch Code Samples und Sample Apps
» Einfaches Dialog-Management via Automation Framework
» Touchpoint zu geni:OS - Zugang zu semvox-Technologien ermöglicht die Umsetzung intelligenter Assistenzsysteme

Text-To-Speech (TTS)
» 65 Sprachen
» 152 Stimmen (male/female)
» Multilingual
» Klartext oder SSML-Format möglich
» Emotional TTS*
» Custom Voice
» Prompt Tuning
» Gilded Speech für Android
» TTS Service für Android
» Mehrere Instanzen parallel
» Offline Generierung von mave/mp3
» Markup zur Steuerung der Klangfarbe*
Automatic Speech Recognition (ASR)
» Wake-Up Word
» Barge-In
» Grammatikbasierte Erkennung
» Erkennung dynamischer Slots
» Unterstützung von Dictionaries
» Embedded Freitexterkennung (Open Domain)
» Voice Biometrie*
» Geräuscherkennung
» Geringe Sprachverzögerung
Use Case Beispiele
Schlüsselworterkennung
System:
“Welches Restaurant soll ich für Sie suchen?”
Nutzer:
“Hmm, ich habe heute Lust auf Chinesisch”
Multilinguale Sprachmodelle
Nutzer:
“Spiele ‚Clair de Lune‘ von Claude Debussy”