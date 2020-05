von Loric Lehmann

Herr Maurer, wann haben Sie zuletzt mit einem Sprachassistenten gesprochen? Was haben Sie gefragt?

Heute Morgen, als ich die Morgenroutine auf dem Google Assistant gestartet habe. Diese macht das Licht an und liest mir die gewünschten News des Tages während dem Aufstehen und Kaffeemachen vor. Sehr praktisch ist die Technologie auch beim Zubettgehen: Wenn man bereits im Bett liegt und noch ein Licht brennt, kann man das mit einem Satz bequem von der Matratze aus löschen – vorausgesetzt, man hat ein Smart-Lichtsystem in der Wohnung.



Laut der Studie von Farner, der Uni Luzern und der Swisscom, bei der Sie Koautor waren, nutzen bereits 51 Prozent der Schweizer Bevölkerung Sprachassistenten. Letztes Jahr waren es lediglich ein Drittel. Wie erklären Sie sich diesen Ansprung innerhalb eines Jahres?

Wie so oft hinken wir in der Schweiz bei der Adaptierung einer Technologie anderen Ländern ein wenig hinterher. Dafür sind wir aber immer schnell, wenn sich eine neue Technologie durchsetzt. Ausserdem hat praktisch jede Person mit einem Handy auch einen Sprachassistenten auf sich. Für einmal ist es eine Technologie, die man bereits auf sich trägt.



Wie beurteilen Sie den Umgang der befragten Personen – insbesondere der Deutschschweizer –, mit den Sprachassistenten Standarddeutsch zu sprechen?

Man macht es, weil es notwendig ist. Der Umstand, dass dies meistens in einem privaten Umfeld passiert, macht es auch leichter. Es liegt aber in der Natur der Sache, dass wir am liebsten in unserer angeborenen Sprache mit einem Sprachassistenten sprechen möchten.



«Überall dort, wo man die Hände voll hat, machen Sprach-assistenten Sinn»

Wie gut ist die Verständlichkeit von Mundart für Sprachassistenten? Sind da einige schon weiter als andere?

Ja, da ist sicher Google recht weit. Aber nicht so, dass es bereits für alles funktioniert. Eher alltägliche Dinge wie «Okay Google, wie wird ds Wätter?» funktionieren bereits sehr gut. Die Tatsache, dass Google auch in Zürich an der Entwicklung des Google Assistant arbeitet, fördert sicherlich das Bewusstsein für das Schweizerdeutsch. Ich denke auch, dass es eine Challenge ist, so unterschiedliche Dialekte wie wir in der Schweiz sprechen, zu verstehen. Wer dies kann, wird dieses Know-how sicher auch für andere Sprachen und Dialekte nutzen können.

Wofür werden Sprachassistenten am meisten gebraucht?

Für einfache Dinge wie Musik und Licht steuern, die Einkaufsliste füllen, Timer setzen in der Küche, Wetterprognosen und generell Dinge im Internet abfragen. Wenn ich beispielsweise ein Buch lese und etwas nachschlagen will, mache ich das mittlerweile, ohne das Buch abzulegen. Ich kann ganz schnell und einfach den Google Assistant fragen und bleibe so viel besser im Lesefluss.

Die Studie zeigte ausserdem, dass mit dem Auto nun öfters geredet wird als mit dem Desktop. Woran liegt das?

Viele neue Autos haben bereits einen Sprachassistenten eingebaut, und überall dort, wo man die Hände voll hat, machen Sprachassistenten Sinn. Radio steuern, Licht ändern oder eben auch andere Dinge, die so erledigt werden können, ohne grosse Ablenkung vom Strassenverkehr.

«Jede Firma, die einen Kundendienst hat, wird sich früher oder später mit Voice User Interfaces auseinandersetzen»

Smart Speakers werden in der Schweiz noch selten benutzt. Wird sich dies noch ändern?

Ganz sicher. Man muss sich bewusst sein, dass bis im Oktober 2019 nur Smart Speakers aus dem Graumarkt in der Schweiz erhältlich waren. Man bekommt praktisch alles in der Schweiz, was auf dem Smart-Speaker-Markt erhältlich ist – offiziell sind sie hierzulande aber gar nicht gelaunchet. So gibt es zum Beispiel die Alexa-App in den Schweizer App Stores nicht, was auch die Anwendung ein wenig komplizierter macht. Nun kann man aber zwei Modelle von Google Nest im Google Store Schweiz und im Fachmarkt kaufen. Die Einstiegsmodelle sind bereits für unter 100 Franken zu haben. Es ist also auch in der Anschaffung eine günstige Technologie.

Wo liegen die Chancen für Kaufprozesse mit dieser Technologie – dem sogenannten «Voice Commerce»?

Überall entlang der Customer Journey, wo durch ein Voice User Interface das Kundenerlebnis vereinfacht oder verbessert werden kann. Dort, wo Leute Fragen haben, ohne direkt eine Marke im Kopf zu haben. Zu Beginn des Kaufprozesses kann man Beratungs-Apps erstellen, die einem im Kaufentscheidungsprozess helfen sollen, das Richtige zu kaufen. Am anderen Ende des Kaufprozesses kommt der Kundendienst. Jede Firma, die einen Kundendienst hat, wird sich früher oder später mit Voice User Interfaces auseinandersetzen.

Wieso das?

Es kann 24/7 für Kunden da sein, ohne Warteschleife. Gerade bei Banken und Versicherungen sind ein grosser Anteil der Kundenanfragen immer wieder die gleichen. Stellen Sie sich vor: All diese Fragen werden automatisch beantwortet und ohne Wartezeit. Das ist ein Win-win für Firma und Kunden. Was man auch oft sieht, ist der Einsatz zu Beginn des Kundendienst-Calls. Standarddinge abfragen kann man schon sehr gut mit einem Voice User Interface. So kann man den Call auch besser der richtigen Peron oder Abteilung zustellen. Sie sehen, es geht eben nicht nur um die Sprachassistenten von Google, Apple und Alexa. Sprachinterfaces werden auch als Stand-Alone-Lösung eingebaut auf Webseiten, Apps oder eben im Kundendienst in der Hotline. Voice User Interfaces werden die Art und Weise, wie wir mit der digitalen Welt kommunizieren, stark verändern.

«‹Judihui, wir haben jetzt eine Voice-Anwendung›, wird nicht reichen»

Wo sehen Sie Schwierigkeiten?

Beim Kaufprozess selbst stelle ich leider fest, dass viele Firmen immer gleich mit «Voice Commerce» beginnen wollen. Das kommt wohl von Alexa. Die machen es ja auch, also sollten wir es auch tun. Man darf aber nicht vergessen, dass Amazon Vorreiter ist und über 10'000 Leute an der Weiterentwicklung von Alexa arbeiten. Die entwickeln dies, um zu verkaufen.

Was empfehlen Sie?

Oben (Entscheidungshilfen) oder unten im Funnel (Kundendienst) zu starten. Das zeigen auch Erfahrungen aus den Ländern, wo Voice User Interfaces bereits drei bis vier Jahre auf dem Markt sind. Es ist eine Technologie, in die man sich einarbeiten muss, um Erfahrungen zu sammeln. Warum nicht mit etwas Einfacherem beginnen als komplexe Integrationen in Datenbanken und Systeme? Auch die Kunden müssen zuerst ein Vertrauen in die Technologie aufbauen und werden wohl kaum gleich mit Voice Commerce beginnen. Bedenken sollte man auch, dass die erste Interaktion des Kunden eine sehr gute sein sollte, damit er zurückkommt und es wieder nutzt. Da bieten sich einfachere Dinge viel besser an als bereits eine Kauftransaktion, die auch eine Zahlung beinhaltet. Bei Voice-Anwendungen muss man immer eine Verbesserung in der Customer Journey erreichen. Zeitersparnis, etwas vereinfachen oder einen anderen Mehrwert bieten. «Judihui, wir haben jetzt eine Voice-Anwendung» wird nicht reichen. Das sollten wir von den Apps auf dem Handy gelernt haben.

«Mit Sprachassistenten kann man sich als innovatives Unternehmen positionieren»

Wie gut lassen sich Sprachassistenten in die Markenführung einfügen?

Wenn man es will, sehr gut. Momentan kann man sich mit Sprachassistenten auch als innovatives Unternehmen positionieren. Es gibt auch diesen Aspekt des Branding. Man kann aber auch mit dezentem Soundbranding arbeiten. Da sollte man zurückhaltend sein. So viel wie nötig, so wenig wie möglich. Sonst nervt es relativ schnell, wenn ich einen Brand-Jingle alle paar Sekunden höre. Ich finde es wichtiger, dass man zuerst ein wenig Erfahrungen mit Voice User Interfaces sammelt. Da ist die Markenführung nicht das Wichtigste zu Beginn. Durch die Erfahrung wird man auch selbst ein besseres Bild erhalten, was möglich und angenehm für die Nutzer ist. Mit diesem Wissen lässt sich auch besser eine Strategie entwickeln, wie man die Marke bei Sprachassistenten erlebbar macht.

Werden die Stimmen der Sprachassistenten bald so eindeutig bestimmbar sein, dass wir jenen der Migros von Coop unterscheiden können? Auf was müsste bei der Entwicklung geachtet werden?

Ich denke, ja. Momentan muss man mit den Stimmen arbeiten, die durch die Systeme von Google oder Amazon vorgegeben sind. Dort kann man wie bereits erwähnt mit einem dezenten Soundbranding arbeiten. Bei einer Eigenlösung in einer App kann man die Stimme selbst bestimmen. Früher oder später könnte das auch bei Google und Amazon der Fall sein. Wobei sich Leute bereits an Alexa gewöhnt haben, und eventuell ist es besser, bei dieser Stimme zu bleiben.

Sonst noch was?

Es gibt auch die Möglichkeit, mit voraufgenommener Stimme aus dem Studio zu arbeiten. Je nach Anwendung kann das Sinn machen. Aber man muss sich bewusst sein, dass man damit den smarten Teil der Speaker quasi ausschaltet. Ich kann eben nur mit dem arbeiten, das ich bereits aufgenommen habe und keine Sätze smart auf dem Assistenten generieren. Für den Einsatz von voraufgenommenen Audio-Files gibt es ein gutes Beispiel von einer Whisky-Firma, wo einem in astreinem schottischem Dialekt die verschiedenen Whiskys des Hauses in einem virtuellen Tasting erklärt werden.



Weitere Informationen zum Thema Voice User Interface findet man hier. Da kann man auch einen Voice Readiness Test machen, um zu sehen, wo man selbst mit seiner Firma in diesem Thema steht.