Voice App und Voice Control
integrale Bestandteile in der modernen App-Entwicklung

In diesem Beitrag beschäftigen wir uns mit der Voice-App- und der Voice-Control-Funktionalität sowie damit, welche Bedeutung sie in der App-Entwicklung heute und in der Zukunft haben werden. Auch wenn die Sprachsteuerung derzeit noch zu wenig Beachtung bei der App-Programmierung findet, wird sich das bald rasant ändern.

Die Liste der Apps, die Maja mit der Voice Control führen kann, wird immer länger – und das freut sie. Sie hat gern die Hände frei. Dann kann sie dem Leben besser applaudieren.

Sie kann ihrem Smartphone übrigens heute bereits sagen, dass sie gern mit Tobias per FaceTime sprechen möchte. Mit der Apple Watch stellt sie zuvor noch den Timer, wann ihre Pizza fertig sein soll und per Apple Pay überweist sie endlich 50 Euro an Wikipedia.

Ihr Übersetzer wird ebenfalls über die Spracherkennung aktiviert. Der sucht dann schnell und kompetent die passenden Wörter.

Via CarPlay kann sie später im Auto Voice fragen, ob die Bayern endlich mal wieder verloren haben. Aber dann? Bei anderen Apps, die sie auf ihrem Smartphone hat, antwortet niemand.

Infografik zeigt die Verteilung beim Voice Control

Warum du die Spracherkennung implementierst

Generell stellst du deinem Smartphone eine Frage, und es führt dann etwas aus. ‚Ruf denjenigen an!‘ ‚Bring mich dorthin!‘ ‚Sende eine SMS an …!‘ Und so weiter. Das funktioniert vor allem mit den integrierten Sprachassistenten wie Siri, Alexa, Google und Co schon recht gut.

Darüber hinaus implementieren aber immer mehr App-Entwickler weitere Sprachsteuerungsmöglichkeiten, um dem User eine möglichst handfreie Experience zu ermöglichen.

Von der App zur Voice App

Eine Möglichkeit der modernen App-Entwicklung ist die Voice-App. Das ist eine App, die nur per Sprache funktioniert und eine Erweiterung der regulären und bekannten App-Angebote ist. Viele Apps der ersten Generation bieten diese Möglichkeit noch nicht bzw. nur zum Teil. Warum nicht? Weil die Auswirkungen der Spracherkennung bei der Implementierung nicht konsequent zu Ende gedacht werden.

Dabei nimmt nicht nur die Voice Search stark zu, auch die Voice Control wird, und da braucht man wirklich kein Hellseher zu sein, mittelfristig unser Suchverhalten entscheidend verändern.

Illustration der App zu Voice App Illustration der App zu Voice App

Von der konventionellen App der ersten Generation zur Voice App

Als die ersten Apps vor einigen Jahren erschienen, war die Community entzückt. Die Miniprogramme waren so schlank und schnell. Doch die halbgenialen Entwickler im Silicon Valley oder Bangalore jagten längst einer neuen Form der Suche und der Steuerung hinterher: der Suche mithilfe der Spracherkennung.

Die Suche über die Spracherkennung ist dank der weiterführenden App-Entwicklung mittlerweile in einigen Apps integriert und im Mainstream angekommen. Reine Voice Apps, sogenannte Skills sind auf dem Vormarsch.

Die Voice App ist dabei eine Software, die die bekannten Sprachassistenten bei Android um weitere Funktionen und Möglichkeiten erweitert. Ihre Funktionen werden zwar noch über Siri, Alexa und Co. angesteuert, dann aber von einer privat entwickelten App weitergeführt: „Alexa, öffne mir bitte Fitnesscoach! Starte mein Work-out! Wie mache ich Liegestütze?“

Diese modernen Voice-App-Skills der neuen Generation finden sich beispielsweise im Amazon Skill Store oder dem Google App Store wieder.

Bezeichnungen für die Voice-App-Fähigkeiten

Diese zusätzlichen Funktionen, die mithilfe der bekannten Sprachassistenten angesteuert werden, haben, wie so häufig bei den unterschiedlichen Anbietern, unterschiedliche Namen. Hier ist eine erste Übersicht:

  • Amazon Alexa nennt diese Funktionen ‚Skills‘.
  • Google Assistant bezeichnet sie als ‚Action‘.
  • Bei Samsungs Bixby sind es ‚Capsules‘.

SiriKit – Apples Weg zur Voice Control

Natürlich hat auch Apple das Aufkommen der Voice App bemerkt und mit SiriKit interessierten Webentwicklern ein Kit aus vielen leistungsstarken Tools an die Hand gegeben, mit denen diese ihre iOS- und watchOS-Apps mit Siri zusammenarbeiten lassen können.

Dank SiriKit können User nun etwa CarPlay oder auch ihren Apple-HomePod bei einem Sprachbefehl zunächst die jeweilige App öffnen und haben dann Zugriff auf Listen, visuelle Codes, Fahrtbuchungen, Zahlungen, Work-outs und vieles mehr. Dabei hilft den Entwicklern eine neuartige Verknüpfungsfunktion (Intents-App-Erweiterung), die quasi zwischen die Apps und Siri geschaltet wird und diese zugleich verbindet. Damit können User Aufgaben über Sperr- und Such-Bildschirme oder das Siri-Ziffernblatt ausführen.

Wie viele Voice Apps gibt es überhaupt?

Wie viele Voice Apps es heute direkt gibt, ist schwer einzuschätzen, weil die unterschiedlichen Anbieter sich bedeckt halten und auch unterschiedliche Namen nutzen. Im Amazon Alexa Store gibt weit mehr als 15 000 Skills. Etwa in den Bereichen Spielen, Bildung, Lifestyle, Musik und Nachrichten. Die Steigerung bei den Voice Apps im Kommunikationsbereich ist groß.

Infografik zu Voice Apps in der Unternehmenskommunikation Infografik zu Voice Apps in der Unternehmenskommunikation

Voice Apps und Voice Control in der Unternehmenskommunikation

Die Voice Apps eignen sich nicht nur gut für das B2C-Marketing, etwa in den Bereichen Kundenservice, Kundenbindung und Markenführung. Die Spracherkennung hat sogar einen ganz eigenen Bereich gleich mitgebracht und geprägt: das Voice-Marketing.

Viele Unternehmen rechnen damit, Voice-Technologien im weitesten Sinne in der Zukunft einzusetzen, etwa um dadurch ein modernes und auch spannendes Alleinstellungsmerkmal in ihrer Branche zu erhalten. Das ist auch für kleinere und mittlere Unternehmen sowie stationäre Händler interessant. Denk daran, wir alle können wesentlich schneller reden, als tippen! Wenn dich das interessiert, schreib uns gerne an.

Moderne App-Entwicklung – von der Voice Search zur Voice Control

Doch gehen wir einen kurzen Schritt zurück – ins Heute!

Es stimmt, einige lächeln über diese neue Technologie, klar. Doch nach der erfolgreichen Etablierung der Voice Search, ist der Schritt für viele Digital Natives hin zur Voice Control nicht mehr ungewöhnlich, sondern organisch. Ist ja auch logisch. Die Sprachassistenten werden aktuell bereits für die Suche und das Abspielen von Musik (57 %), das Abrufen des Wetterberichts (55 %) oder die Sprachsteuerung des TV-Geräts (30 %) genutzt.

Ungewöhnlich interessant ist etwas ganz anderes: 28 Prozent der User nutzen die Spracherkennung für ein wirklich reizvolles interaktives Frage-und-Antwort-Pingpong. Das ist nicht nur ein Film. Die Sprachassistenten besitzen (unter anderem auch durch die berühmten Easter Eggs) eine soziale Komponente. Wer schon mal mit seinem Sprachassistenten gescherzt hat, weiß, was ich meine.

Diese Form der Interaktion ist es auch, welche die unendlichen Möglichkeiten der Voice Control aufblitzen lässt. Sie besitzt also mit ihren vielfältigen Anwendungsmöglichkeiten durchaus die Kraft, ein Gamechanger zu werden. Mit den Fingern in der U-Bahn auf dem Smartphone einen Text einzutippen, wird dich eventuell irgendwann ein klein wenig wie Disneys Rotkäppchen im Raumschiff Enterprise aussehen lassen.

Illustration zur moderne Appentwicklung - Von der Voice Search zur Voice Control. Illustration zur moderne Appentwicklung - Von der Voice Search zur Voice Control.
Infografik zu Sprachassistenten und Voice Control Infografik zu Sprachassistenten und Voice Control

Zahlen zu Sprachassistenten und Voice Control

Schauen wir uns doch mal kurz weitere Zahlen von 2019 an! Demnach hat sich die Anzahl der Nutzer von 2017 zu 2019 verdreifacht. Es sind 15 Prozent der Bevölkerung, die zu Hause bereits Smart-Speaker nutzen. Ein weiteres Drittel zeigt generell Interesse. Im Mittelpunkt des Interesses stehen dabei insbesondere Amazon Echo, Google Home und auch Apple HomePod.

Eine Anzahl von Usern steht den Smart-Speakern und der Voice Control skeptisch gegenüber, stimmt genau, insbesondere, was den Datenschutz und auch den möglichen Verlust der Privatsphäre betrifft. Zudem wirkt es auf viele wie eine kindische Spielerei. Mit dem Computer reden, ach nein. – Klar, bei wem die Idee der Voice Control sehr gut ankommt: bei jungen Menschen im Alter von 14 bis 29 Jahren und bei trend- und technologieaffinen Männern. Den Movern und Shakern. Den Early Adoptern.

Was die Voice Control kann

Apple ist mit seinem bekannten Sprachassistenten Siri natürlich nur ein Wegbereiter der Sprachsteuerung. Es gibt ja auch andere klangvolle Namen wie etwa Alexa, Cortana oder Bixby. Der große Vorteil bei Alexa und Siri lautet ja, dass sie mit einer Cloud vernetzt sind. Der Vorteil bei Google und Siri ist aber auch, dass auf deren Betriebssystemen die Möglichkeit besteht, die Sprachsteuerung ohne Internetverbindung zu nutzen. Also ohne Cloud. Dafür müssen die findigen User in ihren Settings allerdings die nötigen Einstellungen vornehmen. Das ist bei einer instabilen Internetverbindung sicher ein Vorteil. Bei uns in der Agentur sind aber die meisten Siris digitalem Designcharme verfallen.

Ihr wollt wissen, was die User aktuell bereits nutzen?

  • Kalender: „Alexa, mein Kalender. Morgen 12 Uhr. Termin mit der Bank!“
  • Bezahldienste: „Hey, Google, zahl bitte an Wikipedia 100 Euro!“
  • Übersetzungen: „O. K., Google, übersetz mir bitte den Text aus der ‚L.A. Times‘!“
  • Sportinformationen: „Hi, Bixby, haben die Bayern heute endlich verloren?“
  • Fotos: „Siri, zeig mir die Fotos von ALEKS & SHANTUs zehnjährigem Jubiläum!“
  • Kamera: „Hey, Google, aktiviere bitte die Kamera!“
  • Karten: „Alexa, zeig mir auf der Karte das Meer und die Sonne!“
  • Filme und TV-Sendungen: „Siri, stell mir bitte den Grand Prix ein!“
  • Websuche: „Hi, Bixby, wo ist hier ein Zahnarzt?“
  • Fragen und Antworten: „Siri, wer sind deine Eltern?“
  • Telefonieren: „Hey, Siri, ruf doch bitte Elton John an!“
  • Uhr: „O. K., Google, stell mir den Wecker auf 6 Uhr 30!“

Apps der ersten Generation – App-Entwicklung ohne Spracherkennung

Viele Voice-Apps haben bereits heute die Fähigkeit der Voice Control implementiert, andere ältere Apps hingegen noch nicht. Die Herausforderung der Veränderung des Suchverhaltens, parallel zum bemerkbaren Fortschritt in der digitalen Technik, wurde hier nicht zu Ende gedacht – weil User eben immer an einen Punkt kommen, wo sie für diese Apps die Finger benötigen. Das Ziel ist es daher, die jeweilige App zu 100 Prozent, ohne einen Finger rühren zu müssen, bedienbar zu machen. Sinnvoll wäre eine durchgängige Nutzung der Sprache als Tool.

Unter diesen Apps der ersten Generation sind etwa so große Player wie:

  • Deutsche Bank,
  • Evernote,
  • Free Now,
  • Facebook,
  • PayPal,
  • Pinterest,
  • Running Adidas.

Datenschutz und Privatsphäre

Ein nicht unerheblicher Teil der Vorbehalte gegenüber der Voice Control, aber vor allem gegenüber der Sprachassistenten, entsteht beim Konsumenten in den Bereichen Datensicherheit und Privatsphäre. Immer wieder werden Sicherheitslücken sichtbar, also dass die Sprachassistenten, obwohl sie nicht angeschaltet worden sind, dennoch Gespräche aufzeichnen oder dass diese sogar verschriftlicht und an die Firmenzentralen geschickt werden. Angeblich von der KI, um die User Experience zu verbessern.

Dass Bankdaten mitgeschrieben und dann Usern zugeordnet werden, ist nicht akzeptabel. Dass dennoch ein großer Teil der Nutzer wenig dagegen unternimmt, ist wieder ein anderes Thema.

Frag uns, wir erstellen dir ein individuelles und tragfähiges Konzept dafür.

Illustration zu Datenschutz und Privatsphäre bei Voice Control in der App Entwicklung Illustration zu Datenschutz und Privatsphäre bei Voice Control in der App Entwicklung

Konzept für die Voice Control in der modernen App-Entwicklung

Jedes Voice-App- oder auch Voice-Control-Konzept ist natürlich ein wenig anders. Standardlösungen gibt es bei uns nicht. Fragen kommen schnell auf. Ist es kostenlos, ein Premium-Abo oder sogar beides? Soll etwas gespeichert werden? Gibt es eine Bibliothek? Wonach soll man suchen können? Gibt es ein In-Skill Purchasing? Eine Empfehlungsabteilung? Auch die Synchronität der unterschiedlichen Systeme müssen wir beachten. Bei dem einen gilt es, mögliche Fragen an die App zu antizipieren, zu sammeln, und auch die nötigen Antworten in einer Database zu hinterlegen.

Illustration zu Userstories Illustration zu Userstories

Dialogisierte User-Storys entwickeln

Bei dem anderen Anbieter müssen Daten katalogisiert und in eine Anwendung umgewandelt werden. Dabei steht jedoch immer der User im Mittelpunkt. Es gilt etwa, eine Vielzahl von individuellen Dialogsituationen bereitzuhalten, die Usern auf ihrem Weg helfen, und diese User-Story mit einem bestimmten Wording zu optimieren und sorgfältig zu pflegen. Dabei ist es wichtig, über eine angenehme Stimme mit den Usern in einen intelligenten und beinahe menschlichen Dialog zu treten. Einseitiges und stumpfes Abfragen von Informationen kann sich kein Unternehmen leisten. Je lockerer, aber auch angemessen attraktiv sich das Konzept gestaltet, desto besser die Kundenbindung.

Lernfähig in die Zukunft

Das Sprachprogramm ist kontextsensitiv und lernfähig. Wörter, die es aufgrund von Dialekten, Sprachfehlern oder ungewöhnlichen umgangssprachlichen Mustern noch nicht kennt, nimmt es auf und fügt sie seinem Repertoire eigenständig hinzu. Ein Satz, mit dem die App sprachlich geöffnet wird, unterstützt die Eigenständigkeit und stärkt die Brand. Ein intelligentes Konzept, für die Voice Control in deiner App zu erstellen, ergibt aus unserer Sicht mittelfristig absolut Sinn. Auch wenn die Spracherkennung das eine oder andere Mal sicherlich Fehler macht und uns zum Lachen bringt, ist die Idee dahinter für viele User von ganz einzigartiger Faszination.

Illustration der lernfaehigkeit von Apps in der Zukunft Illustration der lernfaehigkeit von Apps in der Zukunft
Illustration eines Sigels für Voice Control Illustration eines Sigels für Voice Control

Resümee

Für uns gehört ein intelligentes Voice-App- und Voice-Control-Konzept zur zukünftigen App-Entwicklung dazu. Sie sollte deshalb bereits in der User-Story mit formuliert werden. Sie ist in erster Linie dafür gedacht, um mittelfristig weitreichende technologische und auch soziale Kommunikations- und Anwendungsentwicklungen wie die Voice App mitzunehmen und fundamentale Veränderungen auch weiterhin antizipieren zu können.

Die Voice App wird über kurz oder lang die Nutzung des Touchscreens oder der Tastatur ablösen, das ist klar, und es wird auch einen radikalen Wechsel in manchen Branchen einleiten. Ob deine Firma dafür gewappnet ist oder nicht, das entscheidest du jetzt.

Portraitbild Shantu Bhattacharjee

Du willst mehr wissen über diese spannende Technologie? Kein Problem, lass uns darüber reden!

Shantu Bhattacharjee

Nimm Kontakt zu uns auf!