Ohne Ihnen Grenzen zu setzen, vereinfacht semvox.vi den Zugang zur Modalität "Sprache"

durch die Bereitstellung einer generischen API - in Ihrer bevorzugten Programmiersprache, auf verschiedenen Plattformen und mit ASR- und TTS-Technologien fortschrittlichster Anbieter.

» Einfache Integration von Sprachtechnologien

» ASR & TTS offline und embedded auf dem Device

» Generische Schnittstelle zu verschiedenen ASR- und TTS-Anbietern

» Lauffähig auf verschiedenen Systemen: Linux, Windows, Android, weitere*

» Native und effiziente Implementierung in C

» Anbindung von Java, C#, C, weitere*

» Erleichterter Einstieg durch Code Samples und Sample Apps

» Einfaches Dialog-Management via Automation Framework 

» Touchpoint zu geni:OS - Zugang zu semvox-Technologien ermöglicht die Umsetzung intelligenter Assistenzsysteme

Text-To-Speech (TTS)

» 65 Sprachen

» 152 Stimmen (male/female)

» Multilingual

» Klartext oder SSML-Format möglich

» Emotional TTS*

» Custom Voice

» Prompt Tuning

» Gilded Speech für Android

» TTS Service für Android

» Mehrere Instanzen parallel

» Offline Generierung von mave/mp3

» Markup zur Steuerung der Klangfarbe*

Automatic Speech Recognition (ASR)

» Wake-Up Word

» Barge-In

» Grammatikbasierte Erkennung

» Erkennung dynamischer Slots

» Unterstützung von Dictionaries

» Embedded Freitexterkennung (Open Domain)

» Voice Biometrie*

» Geräuscherkennung

» Geringe Sprachverzögerung

Use Case Beispiele

Schlüsselworterkennung

System:
“Welches Restaurant soll ich für Sie suchen?”

Nutzer:
“Hmm, ich habe heute Lust auf Chinesisch”

Multilinguale Sprachmodelle

Nutzer:
“Spiele ‚Clair de Lune‘ von Claude Debussy”