Quelle: dotnetpro
Offline-Spracheingabe 19.07.2021, 00:00 Uhr

Formelle Spracherkennung

Mit Rhino steht eine Variante der voll offlinefähigen Spracherkennungs-Engine Picovoice zur Verfügung, die über die Wakeword-Erkennung hinaus Grammatiken auswertet.
Geht es um Spracherkennung, so denkt man normalerweise instinktiv an das von Lernout & Hauspie entwickelte Dragon – man labert die Software mit mehr oder weniger komplizierten Sätzen zu, welche diese dann nach bestem Wissen und Gewissen in „nutzbaren“ Text zu verwandeln sucht.
Interessanterweise ist diese freie Erkennung nur einer der möglichen Wege, um Sprache in Kommandos umzusetzen. Ein alternativer Weg, der in vielen Fällen aber bequemer ist und genauere Ergebnisse liefert, ist die Nutzung einer grammatikbasierten Spracherkennung. Für .NET-Entwickler wahrscheinlich am besten sichtbar fand diese sich in Micro­softs SDK für die erste Kinect: Wer seine Sprach-Files intelligent aufbaute und nicht allzu akzentbeladen artikulierte, konnte damit beeindruckende Ergebnisse erzielen.

dotnetpro

Sie wollen zukünftig auch von den Vorteilen eines plus-Abos profitieren? Werden Sie jetzt dotnetpro-plus-Kunde
  • 2 Monate Gratis testen
  • Über 4.000 qualifizierte Fachartikel
  • Auf jedem Gerät verfügbar