Von Spracherkennung zu AR Brille

31.08.2017
Von: Michael Malenke

 

Für einige Jahre waren die Innovationen im Bereich der Smartphones für mich die Treiber für User-Interface-Design. Die spannende Mischung aus den neuen technischen Möglichkeiten, wie hochauflösende Displays in 4 Zoll statt grob-pixelige Displays von Feature-Phones, Touch-Bedienung, der Nutzung von Animationen im Bereich des UI und den Eigenheiten eines mobilen Devices führte zu einem Fokus auf die Gestaltung des Frontends: verkörpert im neuen Berufsbild des UX-Designers. Aber welche weiteren Technologien treiben das UX-Design wirklich voran? Ich beginne mit der Spracherkennung als Basis für eine Sprachschnittstelle.

Fortschritte in der Spracherkennung

Während meiner Zeit am Institut für Nachrichtentechnik an der TU-Braunschweig hatte ich die Gelegenheit im Rahmen des Projektes Verbmobil 1998-2000 Spracherkenner von kommerziellen Anbietern und wissenschaftlichen Einrichtungen zu evaluieren. Das Ziel des Projektes war die Entwicklung eines Übersetzungssystems für kontinuierlich gesprochene Sprache. Die Fortschritte in der Spracherkennung haben mich daher stets interessiert.

Das Thema holt mich nun aus Sicht eines Software-Entwicklers und Lösungsanbieters für Industrie 4.0 Lösungen wieder ein. Wir sehen es bei Alexa, Siri oder dem Google Assistant: Meine Kinder wählen ihre Sendung per Sprachkommando aus, statt sich durch unübersichtliche Menüs zu navigieren. Sie lassen sich von Google das Wetter am Urlaubsort berichten oder sprechen mit der Google-Suche, wo ich - vermutlich noch aus purer Gewohnheit - die Tastatur bemühe. Technisch gesehen, ist der Einsatz der Technologie noch eine Ausnahmeerscheinung bei den Geschäftsanwendungen für den Desktop, auf mobilen Geräten dagegen oder im industriellem Umfeld ist sie dagegen längst angekommen: im Kontext von Industrie 4.0 zeigt zum Beispiel die Spracherkennung ihren Reifegrad: Datenbrille Google Glass in der Intralogistik und Maschinen-Manuals mit Sprachsteuerung in der Fertigungsindustrie. Während ich mich in meinem Studium noch mit selbst trainierten Spracherkennern vergnügte [1], ist die Technologie aus Sicht des Software-Entwicklers heute in Form von Cloud-Diensten einfach verfügbar [2]. Aber auch die offline-fähige Nutzung ist - mit einigen Einschränkungen - nutzbar.

Ein neues User-Interface: die Sprache

Während wir bei der Erstellung von Software-Anwendungen bisher das User-Interface als visuelles Interface in Form von Button, Listen und anderen klassischen UI-Elementen entworfen habe, ist nun zunächst die Frage des geeigneten User-Interfaces zu beantworten. Dann wird für einige Anwendungsfälle die Sprache ihre Vorteile ausspielen und die Sprachschnittstelle die visuelle Schnittstelle ergänzen oder sogar ersetzen. Im nächsten Schritt geht es dann um die Konzeption dieser Schnittstellen. Beispiel: Das Einstellen eines Alarms für 13:00 Uhr per Google Assistant: Der versteht sowohl "Alarm um 13 Uhr aktivieren" als auch "Stelle einen Wecker zu 13 Uhr" oder "ich hätte gerne einen Alarm für 13 Uhr". Die Konzeption von Sprachschnittstellen wird als Voice UX zu einer neuen Disziplin des User-Interface-Designs und entscheidet mit über die Usability des Systems. Es ergeben sich also viele spannende Aufgaben im Kontext des UX-Designs! Welche weiteren Innovationen verändern das Spielfeld des User-Experience- und User-Interface-Designs? Kandidaten sind die AR-Brille, die eingeblendet in die Umwelt ein 2D- oder sogar 3D-User Interface ermöglicht und der Chatbot zum Realisieren von textbasierten Schnittstellen.

Für einen Gedankenaustausch zu diesem Thema aber auch allgemeinere Fragen zum UI/UX-Design sprechen sie mich gerne an. Gerade im Bereich Industrie 4.0 haben wir gute Erfahrungen mit Pilotprojekten gemacht, wo gemeinsam mit dem Kunden neue Technologien im Kontext konkreter Problemstellung getestet werden.

------

[1] Damals waren Hidden-Markov-Modelle angesagt und die freie Verfügbarkeit von Sprach-Corpora entscheidend.

[2] Amazon Voice Service, Google Cloud Speech API, IBM Watson Speech-To-Text

 

 


Kategorie: Design, Development, IoT

INDIVIDUELLE SOFTWARE

KONTAKT | IMPRESSUM | DATENSCHUTZ | AGB