Bachelorarbeit zum Thema - opus.ostfalia.de · intelligenz HAL 9000 zusammenzuarbeiten. »Man...

62

Transcript of Bachelorarbeit zum Thema - opus.ostfalia.de · intelligenz HAL 9000 zusammenzuarbeiten. »Man...

Bachelorarbeit zum Thema:

Chancen und Risiken von Voice User Interfaces im Marketing

und im User Engagement

in Zusammenarbeit mit Kolle Rebbe

zur Erlangung des Grades Bachelor of Arts

Fakultät Verkehr-Sport-Tourismus-Medien

vorgelegt von: Luca-Maxim Meinhardt

Matrikelnummer: 70455375

Studiengang: Mediendesign

Abgabe: 17. Oktober 2018

Erstprüferin: Professor Jutta Tränkle

Zweitprüfer: Christian Rentschler

Inhalt

Abkürzungsverzeichnis ........................................................................................................................... 8

1. Einleitung .................................................................................................................................... 10

TEIL I – GRUNDLAGEN

2. Die verbale Kommunikation – mehr als Worte ....................................................................... 14

3. Definitionen ................................................................................................................................. 18

3.1. Sprachassistent .......................................................................................................................18

3.2. Voice User Interfaces ..............................................................................................................19

3.3. User Engagement ....................................................................................................................20

4. Historie der sprachbasierten Anwendungen ............................................................................ 22

5. Technischer Hintergrund ........................................................................................................... 28

5.1. Automated Speech Recognition .............................................................................................28

5.2. Natural Language Processing .................................................................................................30

TEIL II – POTENZIALE

6. SWOT-Analyse: Voice User Interfaces ..................................................................................... 34

6.1. Stärken (Strength) ...................................................................................................................34

6.2. Schwächen (Weakness) ..........................................................................................................36

6.3. Risiken (Threats) ....................................................................................................................37

6.4. Chancen (Opportunity) ...........................................................................................................40

7. Zielgruppenanalyse von Sprachassistenten ............................................................................. 44

8. Potenziale für Marken und Unternehmen ............................................................................... 48

9. Voice Search ................................................................................................................................ 52

9.1. Suchmaschinenoptimierung ....................................................................................................53

TEIL III – KONZEPTION

10. KonzeptionelleVorüberlegungenfüreineeffektiveSprachanwendung ............................... 60

10.1. DefinitionderBusinessziele ...................................................................................................61

10.2. Nutzer- und Nutzungsverständnis ...........................................................................................62

10.2.1. Nutzer ............................................................................................................................62

10.2.2. Nutzung .........................................................................................................................63

10.3. Inhalt der Anwendung ............................................................................................................64

11. Reduzierung des kognitiven Aufwands ................................................................................... 66

11.1. Konsistenter Aufbau ...............................................................................................................66

11.2. Aufbereitung der Informationen .............................................................................................68

12. Use Cases für Sprachanwendungen im Marketing ................................................................. 72

TEIL IV – UMFRAGE

13. Umfrage bei Kolle Rebbe ........................................................................................................... 78

13.1. Allgemeine Angaben der Teilnehmer .....................................................................................78

13.2. Sprachassistenten ...................................................................................................................82

13.3. Sprachbasierte Geräte .............................................................................................................84

13.4. Altersgruppen .........................................................................................................................86

13.5. Nutzungsort ............................................................................................................................87

13.6. Potenzial im Marketing ..........................................................................................................88

13.7. Zusammenfassung der Umfrage .............................................................................................89

14. Fazit ............................................................................................................................................. 92

Literaturverzeichnis .............................................................................................................................. 94

Anhang ................................................................................................................................................. 102

»Im Anfang war das Wort […]« (Joh 1,1)

8

Abkürzungsverzeichnis

BfDI – Die Bundesbeauftragte für den Datenschutz und die Informationsfreiheit

HhnE – Haushaltsnettoeinkommen

IVR – Interactive Voice Response

KI – Künstliche Intelligenz

NLG – Natural Language Generation

NLP – Natural Language Processing

SEO – Search Engine Optimization

TTS – Text-To-Speech

VUI – Voice User Interface

10 11Einleitung

1. Einleitung

EinflimmerndesrotesLichthintereinergewölbtenGlasscheibe.

DieComputerintelligenzhatdieabsoluteKontrolleüberalleFunktionendesRaumschiffes.

Er ist allwissend und macht nie einen Fehler.

ObderSupercomputer eigeneGefühle empfindenkann, könnenExpertennichtmitSicherheit sagen.

DochimLaufederZeitwendetsichHAL9000gegendieMenschen,dieihngebauthaben.Erentwi-

ckelteineeigenePersönlichkeit,dieletztendlichvierBesatzungsmitgliederumbringt.Nurmitgrößten

Anstrengungen kann Dave Bowman die künstliche Intelligenz abschalten und sein eigenes Leben retten.1

So stellte sich Stanley Kubrick 1968 in seinem Film »2001: Odyssey im Weltraum« die Zukunft vor.

IneinerSzenewerdendieAstronautenvoneinemFernsehmoderatorgefragtwieessei,mitderComputer-

intelligenz HAL 9000 zusammenzuarbeiten.

»Man gewöhnt sich schnell an die Tatsache, dass er sprechen kann. Und bald redet man

mit ihm genauso, wie mit einem Menschen.« 2

LangebevorSprachassistentenwieAlexa,GoogleAssistantundSiriunsereHandysundWohnzimmer

bevölkerthaben, sahKubrickbereitsdasPotenzialunddieGefahrendieser sprechenden,künstlichen

Intelligenzen. In dieser Bachelorarbeit werde ich seine Diskussion fortführen und mich mit den Chancen

und Risiken von Sprachassistenten im Marketing beschäftigen.

1 Vgl.StanleyKubrick:2001:OdysseeimWeltraum.2001:ASpaceOdyssey.1968

2 Ebd.

DieRelevanzdesThemaswirdalleinschondadurchunterstrichen,dasssichimLaufederletztendrei

Jahre die Anzahl der Nutzer von digitalen Assistenten auf über eine Milliarde Nutzer verdreifacht hat –

einTrend,dersichlautPrognosenindennächstenJahrenfortsetztenwird.3

AusdiesemGrundsolldieseArbeit,eineAntwortaufdieFragefinden,obdigitaleAssistenteneinreales

WerbepotenzialbesitzenodersichdochaufeinederzeitigeModeerscheinungreduzierenlassen,dertrotz

allem Zutrauens der Durchbruch versagt bleibt.

Darüber hinaus wird sich meine Arbeit mit dem User Engagement der digitalen Assistenten befassen.

DarunterverstehtmandieSummederAktionen,diederBenutzter innerhalbeinerSprachanwendung

ausführt.Hier steht die Frage imVordergrund,wie dieGestaltung derAnwendung aussehen könnte,

damit der Nutzer sie als nützlich empfindet und entsprechend das Engagement und die Nutzungs-

häufigkeitgesteigertwird.

Diese Bachelorarbeit gliedert sich in vier Teile:

ImerstenwerdeichaufdieDefinitionderBegrifflichkeitenunddiezeitlicheEntwicklungeingehen,um

daraufhin einen Exkurs zu den technischen Grundlagen der Spracherkennung zu liefern.

ImweiterenVerlaufwerdeich,mithilfeeinerSWOT-AnalysedieChancenundStärkendenSchwächen

und Risiken gegenüberstellen, sowie die Zielgruppe analysieren und das Potenzial für Unternehmen

herausarbeiten.

ImdrittenTeilstelleichkonkreteMaßnahmenfüreineerfolgreicheKonzeptionvonSprachassistenten

vor.ImletztenTeilfließendieMeinungenundAnsichtenvonMarketingexpertenmitein.Diesewurden

im Rahmen einer Umfrage in Zusammenarbeit mit der Hamburger Werbeagentur Kolle Rebbe zusam-

mengetragen.

Im Fazit werde ich basierend auf den Rechercheergebnissen das Marketingpotenzial von digitalen Assis-

tentenabschätzenundmeinepersönlicheMeinungzudemThemaäußern.

3 Vgl.Tractica:AnzahlderNutzervirtuellerdigitalerAssistentenweltweitindenJahrenvon2015bis2021. Statista.2016

GRUNDLAGEN

14 15Die verbale Kommunikation – mehr als Worte

eineArtCodemiteinanderverbunden.DeSaussurebezeichnetdieSeitedesLautbildesalsSignifikant

(Bezeichnendes)unddieSeitederVorstellungalsSignifikat(Bezeichnetes).

Im Rückkehrschluss bedeutet dies, dass Laute undWörter sich unterscheiden können und trotzdem

dieselbeAssoziationhervorrufen,wieesz.B.beiverschiedenenSprachenderFallist.8

In dieser Dualität kann die Macht des ge-

sprochenen Wortes gesehen werden. Denn

die Assoziation des Gesprochenen findet

im Kopf des Gesprächspartners statt 9 und

kann je nach Empfänger unterschiedlich

ausfallen. Je nachdem mit welchen persön-

lichen Erfahrungen und Bewertungen das

Gesagte inVerbindunggebrachtwird,unter-

scheiden sich die Assoziationen.10

Aber nicht nur der Inhalt des Gesprochenen

hat eineWirkung aufdenZuhörer; auchdie

Tonalität des Gesagten ist ausschlaggebend

für die Vorstellung im Gehirn.11 Mithilfe von Spiegelneuronen ist es in der Lage die Gefühle und Emo-

tionen des Sprechenden zu begreifen und Empathie für ihn zu entwickeln.12

Die Tonalität kann sogar ausschlaggebend für das Verhalten von Menschen sein. Dies wird leicht

begreiflich,daeinefreundlicheStimmebeieinemVerkaufsgespräch,eherdazuführt,dassderKunde

dasProduktoderdieDienstleitungerwirbt,alseineunsympathische.13

8 Vgl.ebd.,S.76–79

9 Vgl.ebd.,S.14–15

10 Vgl.Eicher,S.12

11 Vgl.ebd.,S.7

12 Vgl.ebd.,S.39f

13 Vgl.ebd.,S.5–6

2. Die verbale Kommunikation – mehr als Worte

»In der Sprache liegen alle Möglichkeiten des Menschseins beschlossen.« 4

DiesschreibtHansHörmanninseinemWerk»Psychologie der Sprache« von 1967.

Die wichtigste Funktion der Sprache ist der Austausch von Informationen. Es befriedigt das menschliche

Urbedürfnis sichmitzuteilen und auszudrücken.DochSprache kann noch vielmehr. Sie kann,wenn

entsprechendeingesetzt,positiveundnegativeGefühlebeidemGesprächspartnerauslösen.5

Umgekehrt werden auch unsere eigenen Gefühle durch sie wiedergespiegelt. Unbewusst lässt die Stim-

mesogarRückschlüsseaufCharakterzüge,SchulbildungunddiejeweiligeHerkunftzu.6

Der Sprachwissenschaftler Ferdinand de Saussure untersuchte bereits vor über 100 Jahren die Funktion

der Sprache. Er definierte sie als ein System von Zeichen,welchesGedanken und Ideen ausdrückt.7

SeinerAnsichtnach,habenZeichenzweiSeiten.ZumeinendasLautbild,welchesderMenschausspricht

und wahrnimmt. Zum anderen, die Vorstellung, die sich aufgrund des wahrgenommenen Lautbildes

ergibt. Er verdeutlicht dies mit folgendem Modell (Abb. 1):

DieLaute,diedasWort»Baum«bilden,sinddasLautbilddesZeichens.DieandereSeiteistdieVorstel-

lung des physischen Baumes mit seinen Blättern und Wurzeln. Lautbild und Vorstellung sind also durch

4 HansHörmann:PsychologiederSprache.Berlin,Heidelberg1967,S.1

5 Vgl.HansEicher:DieverblüffendeMachtderSprache.WasSiemitWortenauslösenoderverhindernund wasIhrSprachverhaltenverrät.Wiesbaden2018,S.3–4

6 Vgl.DanielHaase,IngoKnopfundShajanRamezanian:DieGeheimnisseunseresKörpers.04.09.2018.Quarks &Co.zuletztgeprüftam19.09.2018

7 Vgl.Ferdinandd.Saussure,Grundfragen der allgemeinen Sprachwissenschaft,3.Aufl.,hrsg.vonBally, Charles,Sechehaye,Albert,De-Gruyter-Studienbuch.Berlin2001,S.19

Abb. 1: Zeichenmodell nach Ferdinand de Saussure

16 Die verbale Kommunikation – mehr als Worte

DiesesurmenschlicheVerhaltenkönnensichSprachassistentenimMarketingzuNutzemachen,umbei

Kunden Aufmerksamkeit für Produkte oder Dienstleistungen zu erzeugen.

Ob digitale Assistenten durch ihre Sprache die »Möglichkeiten des Menschseins« imitieren und

Empathie für sie erzeugen können, wird jedoch im weiteren Verlauf dieser Arbeit nur am Rande

behandelt und ist nicht Inhalt dieser Arbeit.

18 19Definitionen

3. Definitionen

3.1. Sprachassistent

Ein digitaler Sprachassistent ist eine Software, die mithilfe von Sprachbefehlen Aufgaben erledi-

gen kann, wie z.B.Wetterberichte vorlesen, E-Mails verschicken oder Kalendereinträge tätigen. Die

derzeit bekanntesten Sprachassistenten sind Siri, Google Assistant, Alexa und Cortana. Diese sind

sowohlaufSmartphonesverfügbar,14alsauchinseparatenVoice-Only-Geräten,wieAmazonEchooder

Google Home. Voice-Only-Geräte auch Smartspeaker genannt, kommen komplett ohne Display und

visuelleEingabenzurechtundsindausschließlichmitderStimmezu steuern.15 Die digitalen Sprach-

assistentenfindenmittlerweileauchEinzuginAlltagsgegenständewieKühlschränke,Autos,odersogar

Badezimmerspiegeln.16

DieHauptleistungderAssistentenbestehtdarin,sprachlicheBefehle innatürlicherSprachezuverste-

hen und zu verarbeiten.17 Mit natürlicher Sprache ist die »normale«Sprachegemeint,diewirimAlltag

verwenden.Dabei kommt esweniger darauf an, dasGesagte zu erkennen, als vielmehr dasGesagte

sinngemäßzuverstehen.DieserProzesswirdNaturalLanguageUnderstandinggenannt.18

14 Vgl.HeidemarieSchuster:WasisteinSprachassistent?VogelCommunicationsGroupGmbH&Co.KG.2017

15 Vgl.CathyPearl:Designingvoiceuserinterfaces.Principlesofconversationalexperiences.Beijing2017,S. 1–2

16 Vgl.TillS.Nagel:CES:DigitaleSprachassistentensind2018eingrossesThema.2018

17 Vgl.Pearl,S.156–59

18 Vgl.ebd.

3.2. Voice User Interfaces

DieNutzungvonVoiceUserInterfacesistnichtswirklichNeues.JamesGiangola,MichaelCohenund

JenniferBaloghdefiniereninihremBuch»Voice User Interface Design« bereits 2004 VUIs folgender-

maßen:

»A Voice User Interface is what a person interacts with when communicating with a

spoken language application.« 19

SobaldderNutzer folglichseineStimmebenutzt,umeineAnwendungzusteuern,befindeter sich in

einem sprachbasierten Interface. Diese können weiter unterteilt werden inAuditority Interfaces und

Multimodale Interfaces. Letztere kombinieren das Medium Sprache mit einem grafischen, visuellen

Interface,währendAuditoryInterfacesausschließlichperSprachezubedienensind.

Ein weiteres Teilgebiet der Voice User Interfaces sind Spoken Language- bzw. Conversational Inter-

faces.DerenAnspruch istes,einenatürlicheKonversation,ähnlichwiezwischenzweiMenschen,zu

führen.Dabeiisteswichtigzubeachten,dassSprachenichtexplizitfürdieAnwendunggelerntwurde,

wie z.B. derUmgangmit einer visuellenBedienoberfläche, sondern implizit in der frühenKindheit.

Entsprechend sollte sich auch das auditive Interface an die menschliche Sprache anpassen und nicht um-

gekehrt.DenndieAussprache,derSatzbauoderdieArtwelcheInformationenzuwelcherZeitanden

Gesprächspartnerübermitteltwerden,istmindestensgenausowichtigfürdieKommunikation,wieder

Gesprächsinhalt.20 Zudem werden typischerweise im weiteren Verlauf eines Gespräches Informationen

wiederaufgegriffen,dieamAnfangderKommunikationgenanntwurden.DiesmussbeiderGestaltung

einesConversationalUserInterfacesbeachtetundzwischengespeichertwerden,dadieKommunikation

ansonstenäußersteinseitigstattfindet.AlsBeispielseihierangeführt,dassnachderFragezurAbflug-

19 MichaelH.Cohen,JamesP.GiangolaundJenniferBalogh:Voiceuserinterfacedesign.Boston,Mass.[u.a.] 2004,S.5

20 Vgl.ebd.,S.6–9

20 Definitionen

zeiteinesFlugzeugesundderanschließendenNachfrage,vonwelchemGateesstartet,dasSystemdie

Bedeutung des Wortes »es« in dem zweiten Gesprächsabschnitt einordnen muss.21

3.3. User Engagement

DerBegriffdesUserEngagementstauchtezuerstinden1980erJahrenauf.Seitdemsindvieleverschie-

deneDefinitionenentstanden,dieimFolgendenvereinfachtzusammengefasstwerden.

Das User Engagement ist eine Form der Kundenbindung bei einer Webseite, App oder anderem

interaktivenMedium. Das Engagement hängt eng mit der User Experience zusammen, welches die

Erfahrung bzw. das Erlebnis des Nutzers mit der Webseite oder App wiederspiegelt.22

BetrachtetmandasUserEngagementgenauer,soistesdieGesamtheitderInteraktionen,dieeinNutzer

ineinerAnwendungausführt.DiesewirdbeeinflusstdurchdieAufmerksamkeitundMotivationdesNut-

zers,schließtaberauchdieZeit,dieermitihrverbringt,ein.

Dabeiisteswichtig,eineUnterscheidungzurUserExperiencefestzulegen,denneinesolchebedeutet

nicht,dassaucheinhohesEngagementvorliegt.DasEngagementzeigt,inwiefernNutzereinenMehr-

wertausderUserExperience,alsoausdemErlebnisziehenkönnen.

Das Engagement kann in zwei Bereiche unterteilt werden: Die »Engaging Interaction«, welche die

einmalige Benutzung einer Anwendung beschreibt und das »Long-time-Engagement«,welchediemehr-

malige Nutzung über einen längeren Zeitraum darstellt.

Zusammengefasst ist das User Engagement die emotionale, wahrgenommene und verhaltensbasierte

ErfahrungdesNutzersbeieinerAnwendung,diezueinerbestimmtenZeitundübereinenlängerenZeit-

raumstattfindet.23

21 Vgl.Pearl,S.6–8

22 Vgl.JörgPflüger:Ist»UserEngagement«messbar?enconda.2016

23 Vgl.MouniaLalmas,HeatherO‘BrienundEladYom-Tov:Measuringuserengagement.38SanRafael,Calif 2014,S.2–3

22 23Historie der sprachbasierten Anwendungen

4. Historie der sprachbasierten Anwendungen

Bereits in den 50er Jahren experimentierte das Entwicklungszentrum »Bell Labs« – eine Tochtergesell-

schaftdesfinnischenHandyherstellersNokia–aneinerMöglichkeitZiffernviaSpracheerkennenzu

können.DiesesSystemfandaußerhalbderFirmajedochkaumAnwendungsmöglichkeiten.Dochinner-

halbvonzehnJahrenwuchsdieAnzahl,dervomSystemverstandenenWorte,beträchtlich.Eswurden

allerdings nur Stimmen von bestimmten Personen erkannt. Erst in den 1990er Jahren wurden die ersten

»Speaker-Independent-Systeme«entwickelt,dieWörterunabhängigvomSprechererkennenkonnten.

NochJahrzehntevordenVoiceUserInterfaces,diemitderStimmegesteuertwerden,entwickelteder

InformatikerJosephWeizenbaum1966denerstenText-basiertenChatbotnamensELIZA,derAussagen

indernatürlicheSprachedesMenschenverarbeitenundaufdessenBasis,passendeRückfragenstellten

konnte.24 ELIZA ebnete den frühenVUIs ihrenWeg in dieGesellschaft, die ihrenDurchbruch aller-

dings erst in den 2000er Jahren mit der Einführung der Interactive Voice-Response-Systeme (IVR-Syste-

me)hatten.DieseermöglichtenesNutzernüberdasFestnetztelefonInformationenzuAktienständeund

Verkehrssituationen zu erhalten. Auch konkrete Aktionen wie Geldüberweisungen oder Flugbuchungen

konnten über Sprache gesteuert werden.

Das amerikanische Investmentunternehmen »Charles Schwab«nutzteab1997einIVR-System,mitdem

ihreKundenAktienangebotemehrfachhintereinanderabhörenkonnten.FürvielewardieseineErleich-

terung,dasienichtmehrdasGefühlhatten,einen realenAgentenmitdenselbenFragenmehrfachzu

belästigen.25 Schon damals wurde das Potential der Sprachassistenten bereits erkannt. Mit der Zeit wur-

dendieseständigverbessertundselbst längereSpracheingaben,wiePaketverfolgungs-Nummernoder

24 Vgl.OliverBendel:300KeywordsInformationsethik.GrundwissenausComputer-,Netz-undNeue- Medien-EthiksowieMaschinenethik.Wiesbaden2016,S.60–61

25 Vgl.Pearl,S.1–2

komplexeSätze,wiePlatzierungenbeiPferdewettenkonntenverstandenwerden.

MitdenfrühenSprachsystemenwarenInformationenrundumdieUhrerhältlich,auchzuZeiten,wenn

einmenschlicherAgentnichtzuerreichenwar.GleichzeitigwurdendieIVR-Systemedafürgenutzt,die

Agenten zu entlasten.AnfangswarendieSystemeoftmals so schlecht aufgebaut, dassNutzer immer

wiederversuchten,durcheineHintertüraneinenmenschlichenAgentenzugelangen,ummit ihmzu

sprechen.26 Jedoch war der Fortschritt rasant und kaum zehn Jahre später erfolgte die nächste Revolution

im Bereich der Sprachassistenten.

Siri wurde von dem Stanford Research Institute (SRI) entwickelt und durch dessen Präsidenten Norman

Winarsky 2007 vorgestellt.

Kerngedanke dieses Sprachassistenten war die Zeitersparnis. Durch Sprachbefehle konnten einfache

Anweisungen,wiez.B.dieErstellungvonKalendereinträgen, schnellerdurchgeführtwerdenalsüber

die Tastatureingabe der damals noch sehr unhandlichen ersten Smartphones – vor dem Siegeszug des

iPhones.

Anfang 2010 wurde Siri im Apple Store angeboten und stieg schnell in die Liste der 50 beliebtesten

Apps auf. Nur zwei Wochen später wurde das Unternehmen von Steve Jobs aufgekauft und als neues

Feature des iPhone 4S vorgestellt.27

Im September 2014 folgte dannmitAmazonsAlexa, der nächsteMeilenstein in der Geschichte der

Sprachassistenten. Der Name Alexa ist an die antike Stadt Alexandria und dessen berühmte Bibliothek

angelehnt, die das gesamteWissen derAntike sammelte. Synonym sollAmazons digitalerAssistent

das Wissen der digitalen Welt und ihrer Dienstleitungen zusammentragen und per Sprache verfügbar

machen.

26 Vgl.ebd.

27 Vgl.NormanWinarsky:ThePresidentofSRIVenturesonBringingSiritoLife.Harvard Busisness Review 2015,Nr.9.

24 25Historie der sprachbasierten Anwendungen

Ab 2016 ist die Computerintelligenz Alexa auch in Deutschland verfügbar und ist über unabhängige

Lautsprecherboxen, den Amazon Echos ansprechbar (Abb. 2). Wie oben ausgeführt, werden diese

Lautsprecher Smartspeaker bzw. Voice-Only-Geräte genannt. Neben Standard-Anwendungen wie

beispielsweise der Abfrage von Kalendereinträgen oder Wettervorhersagen können Drittanbieter

sogenannte Skills als Thrid-Party-Apps für Alexa programmieren und auf diese Weise den Funktions-

umfang des Assistenten erweitern. Bei-

spiele für solche Sprachanwendungen

sind der Chefkoch-Skill, den man nach

Rezepten fragen kann, oder der Deut-

sche Bahn-Skill, der Zugverbindungen

heraussucht und vorliest.28 Es gibt bereits

über 15.000 Skills weltweit (Stand: 2.

Quartal2017)29 davon ca. 1.200 im deutsch-

sprachigen Skills-Store. (Stand 2017)30

Alle Sprachbefehle von Alexa werden

an die firmeneigenen Server geschickt, dort verarbeitet, gespeichert und die passende

Antwort zurück an das Gerät gesendet.31 Aus allen gesammelten Daten lernt die künstliche

Intelligenz (KI) mithilfe von maschinellem Lernen dazu und kann entsprechend den Nutzern

immer bessere Antworten liefern. Das bedeutet, je mehr Nutzer und Daten vorhanden sind,

desto besser wird der Sprachassistent.

28 Vgl.RolandEisenbrand:MarketingmitAmazonAlexaSkills:DassinddieerstenReichweitenzahlen.On lineMarketingRockstars.2017

29 Vgl.MathiasBrandt:Alexalerntschnell.Statista.2017

30 Vgl.Eisenbrand:MarketingmitAmazonAlexaSkills

31 Vgl.ThomasKuhn:JetztbringtAmazondiekünstlicheIntelligenzinsWohnzimmer.Wirtschaftswoche, Nr.44(2016):51–52

Google holte im Frühjahr 2017 zum Gegenschlag aus und brachte seinen Smartspeaker Google

Home auf den deutschen Markt. Gleichzeitig gab das Unternehmen seinen Sprachassistenten Google

Assistent für alleAndroid-Smartphones frei, die insgesamt einen Marktanteil von 80% ausmachen.

Somit stehen demUnternehmen sehr viel mehr Nutzerdaten zurVerfügung (z.B. Standortdaten), als

seinemKonkurrentenAmazon,derkeinbekanntesSmartphone-Betriebssystembetreibt(Abb.3).32

Google wird damit allerdings voraussichtlich

keine Monopolstellung im Sprachassistenten-

markt erreichen, denn einige Handyhersteller

bieten Amazons Sprachassistenten Alexa

bereits in den Werkseinstellungen als Standard-

Assistentenan.Mittlerweileistessogarmöglich,

auf allen Android Geräten Alexa als Standard-

Sprachassistenten einzustellen.33 Aber auch

der Handyhersteller Samsung startete seinen

Sprachassistenten Bixby und ist damit zu ei-

nem weiteren Konkurrenten vom Google Assistant geworden.34

Ein paar Monate nach der Einführung des Google Assistant erweiterte das Unternehmen seinen

AssistentenumsogenannteActions,einemPendantzudenSkillsvonAmazonAlexa.Allerdingshängt

Google mit der Anzahl dieser Third-Party-Apps noch weit hinter seinem Konkurrenten Amazon

hinterher.35

32 Vgl.ThomasHeuzeroth:KriegderSprachassistenten.2017

33 Vgl.IngoPakalski:StattGoogleAssistant:AlexaalsStandardassistentaufAndroid-Smartphonesnutzbar. t3nMagazin.2018

34 Heuzeroth:KriegderSprachassistenten

35 Vgl.IngoPakalski:GoogleAssistant:ÜbersichtsseitefürverfügbareActionsgestartet.Golem.de.2018

Abb. 2: Amazon Echo mit der Computerintelligenz Alexa Abb. 3: inergrierter Sprachassistent Googgle Assistent

auf dem Handy

26 Historie der sprachbasierten Anwendungen

Ab dem 18. Juni 2018 ist nun auchApplesKonkurrenzprodukt, derHome Pod,mit seinemSprach-

assistenten Siri auf dem deutschen Markt angekommen.36 Zwar hat Apple für Siri im Sommer 2018

dieEinführungvonsogenanntenShortcutsbekanntgegeben,dieähnlichwieAlexaSkillsoderGoogle

ActionseineArtThird-Party-IntegrationvoniOS-Appsermöglicht.ObdamitjedochexterneMarkenin

ZukunfteigeneAnwendungenfürSirientwickelnkönnenistnochnichtklar.37

36 Vgl.MatthiasKrempp:ApplekündigtHomePodfürDeutschlandan.SpiegelOnline.2018

37 Vgl.NatLevy:SiriShortcutsvs.AlexaSkills.HowAppleistappingappstocompetewithAmazon’svoice assistant.GeekWire.2018

28 29Technischer Hintergrund

5. Technischer Hintergrund

In dieser Bachelorarbeit geht es um die Nutzung von Sprachassistenten im Marketing und die Steigerung

desUserEngagements.FürbeidesisteshilfreicheinGrundverständnisvonderTechnologiezuhaben,

die hinter der Spracherkennung steht. Aus diesem Grund wird sich nachfolgendes Kapitel mit den wich-

tigstenSchlüsselkomponentenbeschäftigen,dieeinreibungslosesundfunktionierendessprachbasiertes

Nutzererlebnisermöglichen.

5.1. Automated Speech Recognition

Automated Speech Recognition (ASR) ist neben dem Natural Language Processing (NLP) die wich-

tigsteKomponente,dieeineSpracherkennungbenötigt.BeidieserTechnologiegehtesumdieErken-

nungderSpracheunddiedarauffolgendeUmwandlungineinenText.38 Vereinfacht läuft diese Sprach-

umwandlung in vier Schritten ab.

Zunächst wird das Gesprochene in eine Waveform Audiodatei umgewandelt aus der anschließend,

soweitmöglich,Hintergrund- und Störgeräusche entferntwerden.Diese optimierteAudiodateiwird

im dritten Schritt in Phoneme zerlegt. Phoneme sind die kleinste Einheit in der (Aus)Sprache. Sie

sindnichtmitBuchstabenzuvergleichen,daz.B.das»sch«ausdreiBuchstabenbesteht,dieineinem

Phonem zusammengefasst sind.

38 Vgl.Pearl,S.107

AbgeleitetausderReihenfolgederPhonemeunddemZusammenhang,welchesPhonemamehestenauf

dasVorherigefolgenkönnte,werdenimletztenSchrittStückfürStückeinzelneWörterundSätzezu-

sammengesetzt.39

UmdieWordErrorRatekleinzuhalten,kommtimASR-ModulderSpracherkennungeinen-Best-Liste

zumEinsatz. In ihrwerden alleSätze aufgelistet, die durch den oben beschriebenenProzess erkannt

wurden.JehöherdieWahrscheinlichkeitist,dassdasASR»denkt«denSatzrichtigerkanntzuhaben,

desto weiter oben steht er in der n-Best-Liste.

Ein Beispiel: In der Sprachanwendungen eines Saftherstellers kann der Nutzer nach Cocktail-Rezepten

fragen.DieAnwendungbegrüßtdenNutzerundfragt:

»Welchen Cocktail möchtest du mixen?«

Der Nutzer antwortet:

»Ich möchte einen Cosmopolitan machen«

Die Spracherkennung erstellt nun die n-Best-Liste.AnersterStellestehtnichtunbedingtauchdas,was

derNutzergesagthat.DieerstenEinträgederListekönntensoaussehen:

1. 92% IchmöchtekeinekomischePolitikmachen.

2. 88% IchmochtekeinekosmischenPollenmachen.

3. 79% IchmöchteeinenCosmopolitanmachen.

4. 72% IchmochtekeinekomischenPolenmögen.

WürdedieSpracherkennungnurdenerstenEintragderListealsAntwortanerkennen,würdedieAn-

wendung wahrscheinlich etwas wie, »Wie bitte? Könntest du das wiederholen« antworten. Da sie

aber »weiß«, dass nach einemCocktailnamen gefragt wurde, kann dieAnwendung die Einträge der

n-Best-ListevonobennachuntennachdiesenSchlüsselwörternuntersuchen.

39 Vgl.MatthewZajechowski:AutomaticSpeechRecognition(ASR)Software.AnIntroduction.Usability Geek.2014

30 31Technischer Hintergrund

In dem dritten Eintrag der Liste ist nun das Wort »Cosmopolitan«zufinden.Diesesist ineinerzuvor

angelegten Liste von Cocktailnamen vorhanden und die Sprachanwendung kann die passende Anleitung

zum Cosmopolitan ausspielen.40

5.2. Natural Language Processing

Das Erkennen der Sprache stellt nur den ersten Schritt dar. Es folgt die Analyse der Bedeutung des

Textes mithilfe von Natural Language Understanding (ein Teilgebiet von NLP). Dies geschieht auf

Grundlage von maschinellem Lernen, wobei sehr große Datenmengen als Trainingsmaterial benutzt

werden.YvonneGöpfertgibtinihremArtikelinderZeitschriftW&VfolgendesBeispiel:Sagentausend

Personen »Mach das Licht an« und jeder möchte mit diesem Sprachbefehl bezwecken, das Licht

anzumachen, sowirdmithoherWahrscheinlichkeitauchder1001.Nutzerdieselbe Intentionhaben.41

DiesistallerdingsnureinsehroberflächlichesBeispielfürdieBedeutungserkennungvonTexten.Das

AnalyseUnternehmenSASInstitutebeschreibtdieHauptaufgabevonNLPdamit,unstrukturierteDaten

in eine vom Computer lesbare Struktur zu bringen.42

Dabei werden die Sätze zunächst auf die Grammatik hin analysiert. Diese sogenannte syntaktische

Analyse ordnet den einzelnen Wörtern ihre grammatikalische Funktion zu. In der darauffolgenden

semantischenAnalysewerdendenWörternihreBedeutungenzugeordnet.ImletztenSchritt,derprag-

matischenAnalyse,wirddieBedeutungderkomplettenPhrasemithilfedervorangegangenenAnalyse

herausgearbeitet und der Kontext ergründet.43

40 Vgl.Pearl,S.120–21

41 Vgl.YvonneGöpfert:Sagwas!SprachsteuerungimMarketing.W&V,Nr.20(2018)

42 Vgl.SASInsitute.WhatisNaturalLanguageProcessing?

43 Vgl.MarcErichLatoschik:SpezielleThemenderKI:NLP-NaturalLanguageProcessing-Sprachverste hen.,2006,S.52

Nachdem der Input desNutzers analysiert und verarbeitetwurde, beginnt der umgekehrte Prozess –

die Sprachsynthese (Natural Language Generation (NLG)). Hier werden, die vom System erzeugten

strukturiertenDaten,zurückinvonMenschenlesbareTexte»übersetzt«.44 Diese Texte werden letztend-

lichwiederinhörbareSpracheumgewandeltundalsAudioabgespielt.DiesenProzessbezeichnetman

als Text-To-Speech (TTS).45 Die Aussprachequalität von TTS ist jedoch noch deutlich als Computer-

stimme wahrnehmbar.

Esbesteht auchdieMöglichkeitmit aufgezeichneterSprache zu arbeiten.DamitwürdendieSchritte

desNLGundTTSwegfallen.DieseMöglichkeitderSpracherzeugungistallerdingswesentlichteuer,da

hierfüreinSprecherundeinTonstudiofürjedeAufnahme,ÄnderungundErweiterungbenötigtwird.46

Gerade beim Onlinehandel mit unzähligen Produktnamen, die ständig aktualisiert werden müssen,

bietetsichTTSan.HiermusslediglichderTextgeändertwerde,anstattineinemTonstudiomenschliche

Sprache bei der Aktualisierung aufnehmen zu müssen.

Auch eine Kombination aus Text-To-Speech und menschlicher Sprache sind möglich. So wird bei

Cortana, dem Sprachassistenten von Microsoft, die Sprache zum Teil aus mehreren Audiodateien

sowohlzusammengesetzt,komplettaufgezeichnet,alsauchdurchTTSgebildet.47

44 Vgl.MaryGlascott:WhatisNaturalLanguageGeneration?narrarivescience.2017.

45 Vgl.TobiasGoebel:Don‘tConfuseSpeechRecognitionwithNaturalLanguageUnderstanding.aspect.2017.

46 Vgl.Pearl,S.148–50.

47 Vgl.ebd.

POTENZIALE

II

34 35SWOT-Analyse: Voice User Interfaces

6. SWOT-Analyse: Voice User Interfaces

NachdemdieGrundlagenderSprachassistentenundderenVoiceUserInterfaceeingeführtwurden,wird

sichdiesesKapitelmitihrenChancenundRisikenbefassen.Umdiesezuanalysieren,wirddieMethode

der SWOT-Analyse (Strength,Weakness,Opportunity,Threat) herangezogen. Sie wird in zwei Bereiche

unterteilt: die interneAnalyse,welche die Stärken undSchwächen desMediumsVoice auflistet; und

dieexterneAnalyse,diedieChancenundRisikenvonSprachanwendungeninBezugaufMarkenund

Marketing aufzeigt.48

TrotzihreseigentlichenAnwendungsbereichs,inderstrategischenPlanungvonUnternehmen,stelltdie

SWOT-Analyseaucheingeeignetes Instrumentdar,umdieVor-undNachteilevonVoiceUser Inter-

faces zu beleuchten.

6.1. Stärken (Strength)

Anwendungen auf dem Smartphone werden in der heutigen Zeit vor allem durch zwei gängige Metho-

dengesteuert.Dies sinddieEingabevonTextenunddieSteuerungdurchGesten,wiedemWischen,

TippenundScrollen.HierstelltsichdieFrage, inwieweitbeidiesenbewährtenAktionendieEingabe

vonInformationenüberSpracheeinenMehrwertdarstellt?

48 Vgl.JürgenFleig:SWOT-Analyse:SowirdeineSWOT-Analyseerstellt.busines-wissen.de.2018

Ein Aspekt dabei ist die Geschwindigkeit.49 In einer Studie der Stanfort Universität und dem chinesi-

schenOnlineunternehmenBaiduvon2016,wurdedieEingabegeschwindigkeitviaiPhoneTastaturmit

dereinerSpracherkennungverglichen.DasErgebniszeigte,dassdieEingabeüberdieSprachebiszu

dreimalschnellerablief,alsüberdieTastatur.50

Ein passendes Zitat lieferte Baidus Wissenschaftschef Andrew Ng:

»Humanity was never designed to communicate by using our fingers to poke at a tiny little

keyboard on a mobile phone. Speech has always been a much more natural way for hu-

mans to communicate with each other« 51

EineweitereStärkeistdieIntuitivitäteinesVoiceInterfaces,dadieEingabemöglichkeiteneinerSprach-

anwendung nicht neu erlerntwerdenmuss. Somit können selbstMenschen, die nichtmit den neuen

TechnologienvertrautsindoderSchwierigkeitenhaben,sichinderderzeitigenMedienvielfaltzurecht-

zufinden,einSprachinterfacebedienen.52DiesführtgleichzeitigzueinergrößerenZufriedenheitbeiden

Nutzern,dennMissverständnisseundBedienfehleraufSeitenderBenutzerwerdendurcheinSprach-

system vorgebeugt.53SelbstverständlichkanndieseStärkenurausgeschöpftwerden,wennindemVUI

vieleverschiedeneAntwortmöglichkeitenfürdenNutzerkonzipiertwurden,umentsprechendsinnvoll

daraufreagierenzukönnen.

EinederinteressantestenStärkenistjedochdieempathischeBeziehung,dieeinNutzerzueinemSprach-

assistentenaufbauenkann.IstdieStimmedesVUIsberuhigendodergestresst?Sprichtsieschnelloder

langsam?VieleCharaktereigenschaftenkönnendurchdieWahlderStimmeunddieArtundWeiseder

Inhaltsübermittlungdargestelltwerden.DiesekönnendemVUIsogareineArtPersönlichkeitverleihen,

49 Vgl.Pearl,S.3

50 Vgl.AartiShahani:VoiceRecognitionSoftwareFinallyBeatsHumansAtTyping,StudyFinds.npr.2016

51 Ebd.

52 Vgl.Pearl,S.3

53 Vgl.Cohen,GiangolaundBalogh,S.10

36 37SWOT-Analyse: Voice User Interfaces

zudereinepersönlicheBeziehungaufgebautwerdenkann.DarausergebensichvieleneueGestaltungs-

möglichkeiten,diebeivisuellenBedienoberflächennichtmöglichwären.54

6.2. Schwächen (Weakness)

NebendenobengenanntenStärkenvonSprachsystemengibtesauchAnwendungsbereiche,beidenenes

nicht sinnvoll ist ein Voice Interface einzusetzen.

DiefehlendePrivatsphäreisteinesolcheSchwäche.BeieinerSprachanwendung,imöffentlichenRaum,

fälltesvielenMenschenschwerprivateoderpersönlicheInformationenpreiszugeben.55

DergrößteNachteilistjedochdasFehleneinesDisplays.DamitfallenwichtigevisuelleElementeder

Informationsvermittlungweg,soz.B.dieAuswahlliste,dauerhafteSichtbarkeitunddieSpeichermög-

lichkeit.

Nach einemAufsatz des Psychologen George Miller, sei der Mensch nicht in der Lage, mehr als

sieben Informationseinheiten im Kurzzeitgedächtnis zu behalten.56 Es ist also nicht sinnvoll eine Liste

einszueinsvonderSprachanwendungvorgelesenzubekommen,dahierbeidiekognitiveAnstrengung

wesentlichhöherist,alsbeieinervisuellenAuflistung.DementsprechendmüssenneueWegeentwickelt

werden,umeineVielzahlvonInformationenübereinenSprachanwendungvermittelnzukönnen.

Ein gängigesMittel ist die Kombination ausAudio und visueller Darstellung, wie es auch bei dem

GoogleAssistantgenutztwird.FragtmannachdenreichstenMenschenderWelt,sowirddemNutzer

eine Liste dieser Personen angezeigt und nicht vorgelesen.57

54 Vgl.ebd.

55 Vgl.Pearl,S.4–5

56 Vgl.GeorgeMiller:ThemagicalnumberSeven,plusorminustwo:somelimitsonourCapacityfor ProcessingInformation.Psychological Review,1955,S.9–11

57 Vgl.Pearl,S.14–15

Eine weitere Methode ist die Inhaltskomprimierung von langen Listen. Sucht der Nutzer beispielsweise

nacheinemRestaurant,kanndie»endlose« Liste durch gezielte Fragen seitens der Sprachanwendung

eingrenztwerden.Mit Fragen zu derNationalität dieKüche, derAnreiseformoder inwelcherPreis-

klassesichdasRestaurantbefindendarf,kanndieListeverkürztwerden.SindnurnochwenigeEinträge

vorhanden,werdendiesevorgelesen.

WeitereMethoden,diedenkognitivenAufwanddesNutzersreduzierenwerdeninKapitel11vorgestellt

und diskutiert.

6.3. Risiken (Threats)

In ihrem Buch »Designing Voice User Interfaces« beschreibt Cathy Pearl Risiken von sprachbasierten

Anwendungen.

Hierzu zählen zunächst ganz allgemeine Bedenken bei der Nutzung von Sprachassistenten. Für viele

Menschen ist es unangenehm mit einem Computer zu sprechen. Sie bevorzugen das vertraute und ver-

traulicheTippen,ummitihrenGerätenzuinteragieren.58

Allerdings ist dies nicht nur ein auf das Medium Voice beschränktes Phänomen. In einem Interview des

Medienprofessors Frank Hartmann in »Die Tageszeitung« spricht er von der Angst über den Kontrollver-

lustbeiderNutzungneuerMedien.ErsiehtdasProblemdarin,dassderMenschvonNaturauseinfaules

Wesensei,derGelernteseinigeZeitlanganwendenmöchte.ErbeschäftigtsichnichtgernemitNeuem

undverlieredamit schnelldenAnschlussanneueTechnologien.DiesesPhänomenbetrifft, lautHart-

mann,nichtnurältereMenschen,sondernistgeradeimdeutschenKulturkreisstarkvertreten.Soseien

dieDeutschenschonimmerkulturpessimistischgewesenundhabenihrehumanistischenGlaubenssätze,

wiebeispielsweise,dasseinBuchimmerbesseralseinBildschirmsei,verteidigt.DiessiehtHartmann

alsGrund,warumneueMedieninDeutschlandnichtsoschnellAnklangfinden,wiez.B.indenUSA.

58 Vgl.ebd.,S.4

38 39SWOT-Analyse: Voice User Interfaces

FüreineerfolgreicheAkzeptanzvonVoiceInterfacessprichtjedoch,dassesvieleBeispielevonMedien

gibt,diezunächstvonderGesellschaftnichtangenommenwurdenundspätertrotzdemAllgemeingutge-

wordensind.DazuzählendieFotografie,diedemAdeldasPrivilegnahm,sichabbildenzulassenoder

derFernseher,derdasharmonischeFamilienlebenzerstörenwürde.59

IneinerDeutschlandumfrageaus2017wurdenachdenmöglichenRisikengefragt,dieSprachassistenten

mitsichbringenkönnten(Abb.4).

An erster Stelle nannten die Be-

fragten die Sorge, dass sie kei-

nen persönlichen Ansprechpartner

mehr erreichen würden und das

Risiko eines immer unpersönlicher

werdendenAlltages(ca.60%)Wei-

terhin wurde die Sorge vor zuneh-

menden Missverständnissen auf-

geführt.60 Technisch kann diesem

Risiko durch ein besseres Design

der VUIs bzw. die Verbesserung der

Spracherkennungssoftware begeg-

net werden.

VondenBefragtensahen30%dieGefahr,dassinZukunftzuvielWerbungaufdenSprachassistenten

laufenkönnte–eineAussage,diediehoheRelevanzdesThemasdieserBachelorarbeitunterstreicht.

DieAbneigunggegenoffensichtlicheWerbungindenMedienbestätigtaucheineStudievon»Exponen-

tial Interactive Deutschland«,diedieAnzahlderangeklicktenDisplaywerbungenbeinur0,02%angibt.

59 Vgl.FrankHartmann,interviewtvonSebasitianKempkens,03.08.2013;WoherkommtdieAngstvorTechnik?

60 Vgl.StatistaundNorstat:WelcheGefahrensehenSiebeiderzunehmendenVerbreitungvon Sprachassistenten?Statista.2017

DazukommtderAnstiegvongenutztenAdblockern,dieeinenWerbeverlustvonbiszu40Milliarden

US-DollarzurFolgehaben.BetrachtetmandiesesWerbevermeidungsverhaltengenauer,sostelltmanfest,

dassalleinschonderEindruck,eskönntesichumWerbunghandeln,dazuführt,dasssieignoriertwird.Diese

Erkenntnissezeigeneinmalmehr,wiewichtigesist,zielgruppenrelevanteWerbungzugestalten,diees

schaffteinenMehrwertfürdenNutzerzukreieren. 61 Im weiteren Verlauf der Arbeit wird dieses Thema

intensiv behandelt.

EinweiteresRisikobeiSprachassistentenstelltderDatenschutzdar.Dieszeigteineweltweite, reprä-

sentativeStudieausdemJahr2018,beider65%derNutzer, fehlendesVertrauen indenDatenschutz

alsGrunddafüranführten,keinendigitalenAssistentenzubenutzten.62 Das diese Sorge nicht unbegrün-

detist,bestätigteinInformationsschreibenderBundesbehördefürDatenschutzundInformationsfreiheit

(BfDI)vomFrühjahr2017.Hierwirddaraufaufmerksamgemacht,dassHackergesprocheneSprach-

befehleabhörenkönnten,umandieverknüpftenZahlungsdatenderNutzerzugelangen.

Ein weiterer negativer Aspekt ist, dass nicht immer transparent vermittelt wird, zu welchem

Zwecken dieHersteller die gespeichertenNutzerdaten verwenden.DieDaten könnten beispielsweise

für personalisierte Werbung genutzt werden.63 Durch den Sitz der großen Hersteller der Sprach-

assistentenindenUSA,bestehtzudemdasRisiko,dasspersonenbezogeneDatenandieNSAgelangen.Denn

amerikanischeFirmensindgesetzlichdazuverpflichtet,demNachrichtendienstEinblickeinihreDaten

zu gewähren.64

61 Vgl.AndreasBaetzgen:BrandExperience:EineEinführung.inBrand Experience: an jedem Touchpoint auf den Punkt begeistern,hrsg.v.AndreasBaetzgen,1.Auflage2015(Stuttgart2015),3–15,14

62 Vgl.JeromeBuvatetal.:ConversationalCommerce:WhyConsumersAreEmbracingVoiceAssistansinTheir Lives.,2018,S.17

63 Vgl.DieBundesbeauftragtefürdenDatenschutzunddieInformationsfreiheit:Internetauftrittder BundesbeauftragtenfürdenDatenschutzunddieInformationsfreiheit-Homepage-Sprachassistenten. Bund

64 Vgl.TanjaTricarico:DatenschutzbeiSprachassistenten:LauschangriffimWohnzimmer.DieTageszeitung. 2018

0% 20% 40% 60%

schwieriger menschl.Ansprechpartner zu finden

unpersönlicher Alltag

Missverständnisse

mehr Werbung

Sonstiges

Nichts davon

Abb. 4: Welche Gefahren sehen Sie bei der zunehmenden

Verbreitung von Sprachassistenten

40 41SWOT-Analyse: Voice User Interfaces

6.4. Chancen (Opportunity)

Basierend auf den Prognosen, liegt die größteChancen vonSprachassistenten fürUnternehmen dem

rasanten Zuwachs von Nutzern zu Grunde. Demnach wird sich die Anzahl der Nutzer bis zum Jahr 2021

auf ca. zwei Milliarden verdoppeln. Es kann folglich von einer immer weiter zunehmenden Etablierung

des Mediums in der Gesellschaft ausgegangen werden.65

ZusätzlichzudenRisikenwurdendieProbandeninderoberenUmfrageauchzudenChancenbefragt,

die Sprachassistenten für dieNutzer bieten könnten,wobei dieMehrheit über eine Erleichterung im

Alltag berichten.66

Aus dieser Erkenntnis ergeben sich wiederum Aufgaben auf Seiten der Marken und Unternehmen. Sie

solltengründlichanalysieren, inwelchenBereichendesAlltagsSprachassistenteneineBedeutungfür

dieKundenspielenkönnen,umsozuerkennen,wannundwoderEinsatzvondigitalenAssistentenim

Marketing sinnvoll ist.67

Eine weitere Chance auf Seiten der Nutzer liegt in der Verkürzung der Wartezeit bei Telefonhotlines.68

WiedasvorangegangeneKapitelzeigt,teilendieNutzeroffenkundigdieSorgeinZukunftkaumnoch

aufpersönlicheAnsprechpartnerzutreffen.GleichzeitigfehltihnenjedochdieBereitschaft,aufdiesein

einerHotlinelangezuwarten.EntsprechendliegteinegroßeAufgabebeidenUnternehmeneinenzufrie-

denstellendenMittelwegzufinden.

Die Stiftung Warentest berichtet in ihrer Zeitschrift »test« vom 27. September 2018, dass keine der

geprüften Gespräche mit Mitarbeitern von Telekommunikationsfirmen als gut bewertet wurden.

Fragen der Kunden wurden oft missverstanden oder keine zufriedenstellenden Antworten geliefert.

65 Vgl.Tractica:AnzahlderNutzervirtuellerdigitalerAssistentenweltweitindenJahrenvon2015bis2021

66 Vgl.StatistaundNorstat:WelchenNutzensehenSiebeiderzunehmendenVerbreitungvon Sprachassistenten?Statista.2017

67 Vgl.FelixStöckle:ConnectingtheDots:DiekomplexenBeziehungenzwischenCustomerJourneys, TouchpointsundBusinessEcosystemverstehen.inBaetzgen,Brand Experience (s.Anm.66),S.170

68 Vgl.StatistaundNorstat:WelchenNutzensehenSiebeiderzunehmendenVerbreitungvon Sprachassistenten?

Hier liegt viel Potenzial bei den Sprachassistenten, diese Mängel zumindest teilweise zu beheben.

Erwähnt werden muss jedoch, dass in dem Test auch die digitalen Assistenten einiger Firmen

überprüft wurden, und zum Teil noch schlechter, als ihre menschlichen Kollegen abschnitten. Dies

zeigt,dassnochvielArbeitindieSpracherkennungunddasSprachverständnisinvestiertwerdenmuss.69

ImVerlaufderoberenUmfragegaben26%derTeilnehmerdenVorteilan,durcheinendigitalenAssis-

tenten weniger Zeit vor einem Bildschirm zu verbringen.70DiesesberechtigeAnliegenderAnwender,

wiederspricht jedoch der breiten Nutzung im Marketing.

IndiesemZusammenhangistumsointeressanter,dasseinigeNutzerindigitalenAssistentendieChance

sehen,einebessereBeratungimKaufvonWarenundDienstleitungenzuerhalten.71 Hier hätten Marken

alsodieMöglichkeitihreKundenaktivzumKaufzubewegenundgleichzeitigeinpositivesImagezu

schaffen.

Cathy Pearl nennt zudem Situationen, in denen die Bedienung einer Anwendung mit den Händen

unangenehm oder gefährlich ist, wie beispielsweisewährend derAutofahrt oder bei anspruchsvollen

handwerklichenTätigkeiten,dieeinhohesMaßanAufmerksamkeiterfordern.72 Ein Beispiel wäre die

Wartung oder Reparatur von Autos. Anstatt mit den verschmutzten Händen ein Smartphone zu bedie-

nen,aufdemdieeinzelnenSchrittezurReparaturvisuellangezeigtwerden,könntedieBedienungper

Sprache das geeignetere Mittel sein. Weitere Anwendungsbeispiele sind Kochrezepte oder Bastelanlei-

tungen.

AlsbarrierefreiesInformationsangebotbietetderSprachassistentzudemdieChanceMenschenmitkörper-

lichen oder geistigen Beeinträchtigungen an diesem Medium teilhaben zu lassen. Somit hätten blinde Men-

schenoderPersonen,dieanderweitignichtinderLagesindSmartphoneszubedienendieMöglichkeitan

Informationen zu gelangen, an die sie ohne digitalenAssistenten nur schwer herankommenwürden.

69 Vgl.StiftungWarentest:HotlinesimTest:BeratenRoboterbesseralsMenschen?test,Nr.10(2018)

70 Vgl.StatistaundNorstat:WelchenNutzensehenSiebeiderzunehmendenVerbreitungvon Sprachassistenten?

71 Vgl.ebd.

72 Vgl.Pearl,S.3

42 43SWOT-Analyse: Voice User Interfaces

Eineweitere überraschendeEntwicklung zeigen die annähernd gleichmäßigenNutzerzahlen über die

Altersgruppenhinweg.DieSprachassistentenwerdenzwaröftervonden»Digital Natives«genutzt,die

mit dem neuen Medium aufgewachsen sind. Doch auch der Anteil der Senioren ist relativ hoch. Somit

trifftdieAussagevonHartmann,dassälterePersonenwenigeraufgeschlossengegenüberneuenMedien

sind,zumindest imFallderSprachassistentennichtzu.Dies istverständlich,dennsie schaffenAuto-

nomität imAlterundermöglichenihneneinenZugangzumSmartphone.73 Diese Zielgruppe sollte für

MarkenundUnternehmen,dieMarketingperSprachassistentbetreibenwollen,verstärktindenFokus

rücken. Denn in Deutschland wird jeder dritter Euro von den über 60-jährigen ausgegeben.74 Auch den

Onlinehandel nutzten bereits über die Hälfte der Senioren.75

Die rechte Tabelle fasst die SWOT-Analyse in einem sogenannten SWOT-Modell zusammen und gibt

einenÜberblickderimTextbehandeltenThemen(Abb.5).EsnenntdieMaßnahmen,dieergriffenwerden

können,umausdenStärkendieChancenzumaximieren,bzw.SchwächenundRisikenzuminimieren.

73 Vgl.SebastianGubernator:Sprachassistenten:Senioren,freuteuchaufSiriundAlexa!Welt.2018

74 Vgl.Statista:AnteilderKaufkraftderDeutschennachAltersgruppen.Statista.2010

75 Vgl.Statista:AnteilderInternetnutzer,dieindenletztendreiMonatenEinkäufeundBestellungenüber dasInternetgetätigthaben,nachAltersgruppenimJahr2017.Statista.2017

Stärken Schwächen

Cha

ncen

Stärken nutzen, um Chancen zu verbessern Schwächen eliminieren, um Chancen zu nutzen

- Verhaltenund»Persönlichkeit«derSprachanwendung auf das Marken-image ausrichten

- Kundenberatung: Kombination aus Sprachassistentundpersönliches Gespräch

- Sprachanwendung speziell für Senioren anbieten

- Kombination aus Audio und visuellen Elementen

- Umfassendes Verständnis des Nutzers und der Nutzung entwickeln

- Antworten durch weitere eingrenzende Fragen optimieren

Ris

iken

Stärken nutzen, um Risiken abzuwehren Verteidigungsstrategien

- Sprachanwendungen,dieschnellerundintuitiver zu bedienen sind als Handy-Apps

- Anwendung muss Mehrwert für den Nutzer liefern

- personalisierte Werbung nur nach positiver Rückmeldung des Nutzers

- wichtige Kundengespräche nicht durch Sprachanwendungen automatisieren

- ransparente Einsicht über den Verbleib und Verwendung der Nutzerdaten

- keineunspezifischenWerbespotsaufSprachassistenten

Abb. 5: SWOT-Modell

44 45Zielgruppenanalyse von Sprachassistenten

7. Zielgruppenanalyse von Sprachassistenten

Der folgende Abschnitt wird sich mit der Analyse der Nutzer von digitalen Sprachassistenten beschäf-

tigen.DarauskönnenRückschlüssegezogenwerden,welcheNutzerdurcheineSprachanwendungam

bestenangesprochenwerdenkönnenunddurchwelchedemografischenMerkmalesiesichauszeichnen.

Statistiken zeigen, dass 40%der 14–19-jährigenSprachassistenten nutzen (Abb. 6). Sie bilden damit

die Altersgruppe mit dem größten Nutzerpotenzial.

Je älter die Zielgruppe wird, desto seltener werden

Sprachassistentenverwendet.Überraschendist,dassder

Nutzeranteil nur geringfügig mit dem Alter sinkt.

Selbst bei den über 60-jährigen nutzt immerhin noch

mehralsjederfünfteeinendigitalenAssistenten,was

erstaunlich viel ist.76

Dieser hohe Nutzungswert kann ggf. darauf zurück-

zuführen sein, dass Sprache eines der ältesten und

intuitivsten Kommunikationswege ist. Im Vergleich

zugrafischenUserInterfacesmüssenfürSprachassistentenkeineneuenTechnologiengelerntwerden.

Dadurch sinkt die Akzeptanzschwelle des neuen Mediums bei den Senioren erheblich.77

EineUmfragederSplendidResearchGmbHzeigt,dassdieNutzungvonSprachassistentenweitgehend

geschlechtsneutralist.39%derMännernutzenbereitsdigitaleAssistenten,einWertdermit35%,kaum

geringer, auchvonderweiblichenNutzerschafterreichtwird.Ebensomarginal sinddieUnterschiede

beidemHaushaltsnettoeinkommen.DieErgebnissedortfolgenkeinemerkennbarenMuster,sodasskein

76 Vgl.BertramBarthundSandraMag.Cerny:IABTrendmonitor:DigitaleAssistenten.,Nr.5432(2017):S.8

77 Vgl.LewisLeong:Whypersonalvoiceassistantsarethenextbigmarketingplatform.2017

direkterZusammenhangzwischenVermögenbzw.EinkommenundderNutzungvonSprachassistenten

gezogen werden kann.78

Etwas anders sieht es bei den verschiedenen SINUS-Milieus®aus.Dieses,inden1970erJahrenentwi-

ckelteModelfasstMenschenmitähnlichenLebensauffassungenund-einstellungeningesellschaftliche

Gruppen zusammen. Die Gruppen werden nach sozialer Schicht und Grundorientierung geclustert und

entsprechend auf den Achsen des oberen Diagrammes aufgetragen (Abb. 7).79

Die hier zugrunde liegenden Umfragedaten stammen aus Österreich. Ein Land, in dem laut dem

78 Vgl.SplendidResearchGmbH:DigitaleSprachassistenten:EinerepräsentativeUmfrageunter 1.024DeutschenzumThemadigitaleSprachassistenten.2017

79 Vgl.BertramBarthundBertholdB.Flaig:HoherNutzwertundvielfältigeAnwendung:Entstehungund EntfaltungdesInformationssystemsSinus-Milieus®.inPraxis der Sinus-Milieus®: Gegenwart und Zukunft eines modernen Gesellschafts- und Zielgruppenmodells,hrsg.v.BertramBarthetal.(Wiesbaden2018),3–22,S.4–5

0% 20% 40%

14-19

20-39

40-59

60+

Abb. 6: Nutzer von Sprachassistenten nach

Alter in Österreich

Abb. 7: Nutzungsanteile von Sprachassistenten in Österreich nach den SINUS©-Milieus

46 Zielgruppenanalyse von Sprachassistenten

SINUS-Institut mehr an traditionellen Werten festgehalten wird und eine geringere Akzeptanz gegenüber

Modernisierungsbestrebungenbesitzt,alsinDeutschland.80

IndemDiagrammistzuerkennen,dassdieAnteilederNutzervonSprachassistentengrößerwerden,

jehöherihresozialeSchichtundjeneuorientierterdasMilieuist.DementsprechendistderAnteilvon

Sprachassistenten-Nutzern bei den Performernmit 36% am größten.81 Dieser Personenkreis zeichnet

sich durch erfolgsorientiertes Denken aus und bilden die Leistungselite einer Gesellschaft.82 Im Gegen-

satzdazuhatdieGruppederTraditionellenmit4%dengeringstenNutzeranteil.83

Die oben erwähnte Umfrage von Splendid Research liefert darüber hinaus Informationen zu den An-

schaffungsgründen von Sprachassistent.Mehr als die Hälfte der 383 befragtenNutzer haben diesen,

bereitsvorinstalliert,mitihremSmartphoneerworben.SiehabensichsomitnichtaktivumdieAnschaf-

fungbemühenmüssen.Fast22%derUmfragegruppesagtenaus,dasssieanKonzeptundTechnologie

der digitalen Assistenten interessiert seien. Zeitersparnis bzw. Bequemlichkeit gegenüber der manuellen

Eingabe führten etwas weniger als jeder Fünfte an.84

Neben denAnschaffungsgründen, wurden die Nutzer auch nach denAnwendungen gefragt, die sie

bei einemSprachassistenten amhäufigsten nutzenwürden.Diese sind dasDiktieren vonMessenger-

Nachrichten(67%),dieSuchfunktionperVoiceSearch(65%)unddasSteuernvonMusik(62%),alsdie

dreimeistgenutztenAnwendungen.Dichtgefolgtdavon,liegenmitjeweils60%Wettervorhersagenund

die Steuerung des Fernsehers über Spracheingabe.85

80 Vgl.ebd.,S.15

81 Vgl.BarthundCerny,S..

82 Vgl.BertramBarth:OrientierunginderUnübersichtlichkeit:DasSINUS-ModellfürJugendlicheund jungeErwachseneinÖsterreich.inBarth;Flaig;Schäuble;Tautscher,Praxis der Sinus-Milieus® (s.Anm.81), S. 81

83 Vgl.BarthundCerny,S.9

84 Vgl.SplendidResearchGmbH:DigitaleSprachassistenten

85 Vgl.ebd.

48 49Potenziale für Marken und Unternehmen

assistenten insgesamt zu einer Steigerung des Onlinehandels kommen wird. 90

AllerdingszeigenandereQuellen,dassdieSorgevoreinemOnlinehandel-MonopolvonAmazontrotz

über 50Millionen verkauftenAlexa-Geräten, zum jetzigenZeitpunkt noch unbegründet ist. In ihrem

Artikel vom August 2018 berichtet das amerikanische Online Magazin »The Information«,dassbisjetzt

nur2%derNutzervonalexabasiertenGeräteneinenEinkaufperVoicegetätigthätten.Vondiesen2%

wiederumwürden90%keinenweiterenvoicebasiertenEinkaufmehrtätigen.91

EsseienbisjetztnursehrwenigeVoice-Einkäufe,erklärteininternerKontaktvonAmazon,allerdings

könnte es zu einem schnellenAnstieg kommen, sobald die Nutzer herausgefunden hätten, was das

Besondere an dieser Art des Einkaufens sei.

Diese Einschätzung bestätigt auch das Strategieunternehmen OC&C Strategy Consults, die einen

Umsatz von 40 Mrd. US-Dollar im Bereich des voicebasierten E-Commerce bis zum Jahr 2022 prognos-

tizieren.92

Hingegen ist Jo Jaquinta, ein Software-Entwickler, der bereits mehrereAlexa-Skills entwickelt hat,

derMeinung,dassSprachanwendungen fürdenSales-Bereichungeeignet seien.Dennerkennekeine

Anwendung,diealleindurchihrein-App-EinnahmendieeigeneEntwicklungfinanzierenkann.Ersieht

das Potenzial vielmehr im Bereich von Public Relations und Marken Awareness.93

Dieses Problem erkannte auch das Startup-Unternehmen Voice Labs. Es hatte sich zum Ziel gemacht

Werbeeinspielungen inAlexa Skills zu implementieren, um diese zu finanzieren. Marken hätten so

dieMöglichkeit, ähnlichwie beiRadiowerbung, ihreBotschaften denNutzern zukommen zu lassen.

Allerdings stellte Voice Labs das Angebot nur wenige Wochen nach dem Start der Werbeausspielungen

wieder ein. Grund dafür seien Änderungen in den Zulassungsbedingungen für Alexa Skills, wie

Voice Labs berichtet. Alexa sehe keine Notwendigkeit Werbeeinspielungen zu erlauben. Ausgenommen

90 Vgl.FlorianKolfundJoachimHofer:Sprachassistent:AlexawirdzumSchreckenderHändler. Handelsblatt.2018

91 Vgl.PriyaAnand:TheRealityBehindVoiceShoppingHype.TheInformation.2018

92 Vgl.ebd

93 Vgl.ebd

8. Potenziale für Marken und Unternehmen

WogenaudiePotenzialederSprachanwendungen imMarketing liegen, umdie zuvorgenannteZiel-

gruppezuerreichen,undwieMarkensienutzenkönnenzeigtdiesesKapitel.

DaserkennbargrößtePotenzialliegtaufSeitenvonAmazon,GoogleundCo.DennsiesindimBegriff

alle existierendenOnlinedienste auf ihren eigenenPlattformen zubündelnund schaffen sichdadurch

einen entscheidenden Wettbewerbsvorteil gegenüber der Konkurrenz.86

Damit werden dieMarktführer zu sogenannten Gatekeepern, die entscheiden, welches Produkt oder

welche Dienstleistung dem Kunden zum Verkauf angeboten wird. Dementsprechend schlägt Amazon

dem Kunden vor allem Eigenmarken vor und erschwert es externen Herstellern überhaupt erst wahr-

genommen zu werden.87DennimGegensatzzueinervisuellenApp,indiederNutzerauseinerlangen

Listevergleichenundauswählenkann,88sindbeidemMediumVoice,nureinbiszweiProduktvorschlä-

gezuhören,daeinehöhereZahlbeimNutzerzurÜberforderungführenwürde.89

Ähnlich argumentieren auch die Autoren Florian Kolf und Joachim Hofer in einem Artikel des

»Handelsblatt«vom18.Juli2018.Siebetonen,dassdieKundenbequemlichkeitverhindernwürdeAlter-

nativen zu vergleichen und dies zu einer Kaufentscheidung zu Gunsten der priorisierten Amazon Eigen-

markenführenwürde.SobestündedieGefahr,dasssichAmazonalsDritterzwischendenKundenund

denHändlerschiebtunddamitdenNutzeraktivdaranhindert,Konkurrenzproduktezuerwerben.

Der Handel im E-Commerce wäre somit eingeschränkt. Gleichzeitig erwartet Achim Himmelreich,

Experte von der Unternehmensberatung Campgemini, dass es aufgrund der Intuitivität von Sprach-

86 Vgl.Kuhn,S.51

87 Vgl.FrankBachér|MelanieSchlegel|MalteKosub|PascalFantou,interviewtvonHaraldFortmann, 11.04.2018,Hamburg;DieneueMarketingweltvonAlexaundCo

88 Vgl.Pearl,S.31

89 EigenerVersuch:»IchmöchteBatterienkaufen«

50 51Potenziale für Marken und Unternehmen

davonseiWerbungbeiSkills,dieRadiostreaming,PodcastoderTageszusammenfassungenenthalten.94

So verkündete derAlexa Skill der amerikanischenTageszeitungWashington Post im Sommer 2016,

dass ihre tägliche Zusammenfassung nun von der Investment-Bank Morgan Stanley gesponsert wird.

Diesgeschieht,ähnlichwievonVoiceLabsgedacht,alskurze15-sekündigeAudioeinspielung,vordem

Podcast.95

Nach einem Artikel der Marketingzeitung »Horizont« wird sich in den nächsten ein bis zwei Jahren

durch Sprachassistenten auch die Werbung im Radio verändern. Denn das Zapping-Phänomen im

Fernsehen bei der Einblendung vonWerbeblöcken findet imRadio derzeit kaum statt. Entsprechend

oftwird derWerbeblock in diesemMedium angehört.Wird dasRadio allerdings über einenSprach-

assistenten bedient, genügt ein Zuruf, um zum nächsten, werbefreien Sender zu wechseln. Experten

erwartenausdiesemGrund,dassAmazonsichähnlichwieimBereichdesE-CommercezwischenSender

und Hörer platzieren wird, um zum Beispiel bei jedem Senderwechsel Werbung zu spielen. Diese

könnedankpersonenbezogenerDatenauchpersonalisiertwerden.96

NebendengeringenMöglichkeitenWerbungaufSprachassistentenabzuspielen,istauchdieVerlinkung

zu externen Apps oder Webseiten technisch bis jetzt noch nicht etabliert. Damit ist die Chance mit einem

SkilldieDownloadzahleneinerAppoderdieAnzahlderBesuchereinerWebseitepositivzubeeinflussen

derzeitnochzugering,alsdassessichlohne,GeldindieEntwicklungenzuinvestieren.97

AufderanderenSeitesprichtMicrosoftsCEOSatyaNadelladavon,dassder40MilliardenUS-Dollar

schwereApp-MarktinZukunftvon(Sprach-)Botsersetztwerdenkönnte.98

94 Vgl.IngoPakalski:VoiceLabs:VorerstdochkeineWerbunginAlexa-Skills.Golem.de.2017

95 Vgl.WashingtonPostPR:MorganStanleysponsorsTheWashingtonPost’s2016flashbriefingson Alexa-enableddevices.WashingtonPost.2016

96 Vgl.JulianePaperlein:DieAudio-Revolution:Alexa&Co:WieSprachassistentenundSmartspeakerdas RadiounddasMarketingverändern.Horizont,32/2018(2018):S.8–9

97 Vgl.Eisenbrand:MarketingmitAmazonAlexaSkills

98 Vgl.Kuhn,S.51

DiederzeitigeNutzungderAlexaSkillshängtihremPendant,denvisuellenAppsderzeitnochdeutlich

hinterher.AllerdingsgibteserstaunlichvieleNutzer,wenninErwähnunggezogenwird,welchkurzen

Zeitraum die Sprachassistenten im Vergleich zu den visuellen Smartphone-Apps erst auf dem Markt

sind.99

EntsprechendgroßistdasPotenzialdesEinsatzesvonGoogleActionsoderAlexaSkillsimMarketing

vonUnternehmen.MiteinemVoiceInterfacekönnendieNutzerpersönlichmitderMarkesprechenund

das Unternehmen antwortet direkt. Dies kann die Hürde zur Nutzung eines Produktes oder einer Dienst-

leitung reduzieren und gleichzeitig zu einer Festigung der Kundenbindung führen. Zum Beispiel bietet

dieamerikanischeBankCapitalOneihrenKundenan,ihrenKontostandunddieletztenKontobewegun-

gen durch einen Alexa Skill zu erfragen.100

WieschoninderfrühenZeitderIVR-SystemekönntenSprachanwendungendenKundenserviceauto-

matisieren.DamitkönntePersonalgespartundeffektivereingesetztwerden.Aufeinfacheundhäufige

KundenfragenkönntederSprachassistentmitstandardisiertenAussagenantworten.WerdendieFragen

komplexer und spezifischer, würde derKunde an einenmenschlichenAnsprechpartnerweitergeleitet

werden,derdenServicefortführt.101

DaskonkretePotenzialeinesMediumszubeschreiben,welchesnochindenKinderschuhensteckt,ist

schwierig.Doches istnichtzuübersehen,dassSprachassistentenschon jetzteine immergrößerwer-

dende Rolle im Leben der Menschen spielen. Also sollten sich auch Unternehmen mit den Potenzialen

diesesMediumsfrühzeitigbeschäftigen,umihrezukünftigenundderzeitigenKundenzuerreichen.

99 Vgl.Eisenbrand:MarketingmitAmazonAlexaSkills

100 Vgl.RolandEisenbrand:MarketingmitAmazonAlexaSkills:DassinddieerstenReichweitenzahlen. OnlineMarketingRockstars.2017

101 Vgl.AlexandraLindner:5Marketing-TippsfürSprachassistenten.com!professional

52 53Voice Search

9. Voice Search

»Eine Suche ist eine Form der Frage-Antwort-Kommunikation. […]« 102

Nach der These des Horizont-Autors André Vieregge geht es bei Voice-Search um kurze verständliche

Antworten,diedieSuchanfragedesNutzersklärenundbeenden.103

Anders sieht dies Oliver Barrenbrügge, wie er in einem Bloggbeitrag der Marketingagentur iCross

beschreibt.Erbetont,dassgeradeW-FragenRückschlüsseaufdieIntentiondesSuchendenzulassenund

anhandihrerzuerkennenist,inwelcherEntscheidungsphasediesersichgeradebefindet.Diesgilteszu

nutzen,ummiteinerzielgerichtetenKommunikationdieSucherergebnissezuoptimieren.

Fragen,diemit»Was…?« oder »Wie…?«beginnen,deutendaraufhin,dassderNutzersichnochinder

Recherchephase befindet. Stellt er allerdingsFragen, diemit»Wo…?« oder »Wann…?« beginnen, so

hatersichbereitsentschiedenundistbereitzuhandeln,indemerz.B.einenLadenbesucht,einProdukt

kauft oder eine Dienstleistung in Anspruch nimmt.104

Hier verweist Barrenbrügge auf den Vergleich zwischen Sprachassistenten und Verkäufern im echten

Laden.ErstelltdieFrage,wiesicheinVerkäuferverhaltenwürde,dervoneinemKundenmiteinerW-

Frage konfrontiert wird.105AlltäglicheErfahrungenzeigen,dassderVerkäuferbeidenFragen»Was…?«

oder »Warum…?«denKundenzudeminteressierendenProduktbzw.derDienstleistung,beratenwürde.

WeiterführendbeginntindieserBeratungs-Phase,trotzderzuBeginndesKapitelsaufgestelltenThese,

eine Konversation zwischen Verkäufer und Käufer.

102 AndréVieregge:VielLärmumnichts:WasVoiceSearchwirklichfürSEAbedeutet.Horizont.2017

103 Vgl.ebd.

104 Vgl.OliverBarrenbrügge:TheDivineVoice-DiegöttlicheStimme?-TeilEins.iCrossing.2018

105 Vgl.ebd.

Um ein Beispiel zu nennen:

EinKundeerkundigtsichineinemFahrradgeschäft,wasfüreinRadambestenfüreineTourin

den Bergen geeignet ist. Anstatt dass der Verkäufer kurz und knapp mit Mountainbike antwor-

tet,wirderwahrscheinlichdemKundenweitereFragenstellen,umbesseraufseineWünsche

einzugehen.ZumBeispielwieteueresmaximalseindarf,obderKundeeinebestimmteMarke

präferiert oder ob er bereits Erfahrung mit Bergtouren hat.

ZiehtmandenVergleichzurückzuVoiceSearch,sosolltediesprachbasierteSuchenichteinfachnurein

Frage-Antwort-Formatsein,wiezuBeginnzitiert.VielmehrkönntejenachFragedesSuchenden,der

SprachassistentpassendeergänzendeFragenstellen,umdieSuchergebnisseeinzugrenzenundzuverfei-

nern und damit besser die Intentionen und Wünsche des Kunden zu befriedigen.106

DerstrukturelleAufbauvonVoiceSearchsollesichdahernichtanderherkömmlichenSucheperTasta-

tur orientieren – sondern an dem Verkaufsgespräch eines realen Verkäufers.

1.1. Suchmaschinenoptimierung

Bereits letztes Jahr sagteGooglesCEOSundarPichai,dass20%allerSuchanfragenbeiGoogleüber

die Stimmeneingabe abgewickelt werden.107 Prognosen sagen bis zum Jahr 2020 sogar einen Zuwachs

von30–50%voraus.108EntsprechendwichtigistdieFrage,wieMarkenaufdiesenAnstiegvonVoice-

Search-AnfragenreagierenundSuchmaschinenoptimierungbetreibenkönnen.

106 Vgl.ebd.

107 Vgl.Vieregge:VielLärmumnichts:WasVoiceSearchwirklichfürSEAbedeutet

108 Vgl.OliverBarrenbrügge:TheDivineVoice-DiegöttlicheStimme?-TeilEins.iCrossing.2018

54 55Voice Search

Durch die digitalenAssistenten hat sich dieArt undWeise, wie nach Informationen gesucht wird,

verändert.FrüherbestandenSuchanfragennochauseinzelnenKeywords,diesoknappwiemöglichdas

Gesuchte wiedergegeben haben. Durch Sprachassistenten nähern sich die Suchanfragen immer weiter

dernatürlichenSprachean.EntsprechendwirdvielnachsogenanntenLong-Tail-Keywordsgesucht,also

längere, zusammenhängendeSätzeoderFragen.Dies sindvorallemdie typischenW-Fragen.Anstatt

also nach »bestes Café Hamburg« zu suchen, sindbeiVoiceSearchAnfragenwie»Wo finde ich das

beste Café in Hamburg«zuhören.

DieseAnfragensindinderRegelpräziser,sodassirrelevanteSuch-Ergebnisseausgeschlossenwerden

können.AndréViereggenenntfolgendesBeispiel:WennmandendigitalenAssistentennach»Wie schwer

darf mein Koffer sein«fragt,soisteindeutig,dasskeineErgebnissezumKaufeinesKofferserwünscht

sind, sondern das Gewicht beim Fliegen, obwohl das Schlüsselwort »Koffer« in der Search-Query

vorkommt.109

WelcheMaßnahmenkönnenalsoWebseitenbetreiberergreifen,umauchüberVoiceSearchgefundenzu

werden?ZudiesemThemahatJohnMueller,SeniorWebmastervonGoogle,AnfangdesJahres2018

einLive-InterviewaufGooglesMessengerHangoutgehalten,indemeraufFragenzuaktuellenVoice-

Search-Trendseingegangenist.DiesebeinhalteteunteranderemauchdieMethoden,dieergriffenwer-

den können, damit Webseiten Voice-Anfragen zufriedenstellend beantworten und entsprechend von

Google besser gerankt werden.

Muellerbetont,dassdieTechnologieamAnfangstündeundnochvielArbeitvonGooglesSeiteerfor-

derlichist.AberauchdieNutzermüssensichdarüberklarwerden,wassievonVoiceSearcherwarten.

Dies sei allerdings ein sich langsam entwickelnder Prozess.

DerContent der Seite sollte so geschrieben sein, dass er natürlich klingt und problemlos vorgelesen

werdenkann,soMueller.EntsprechendmachediekünstlicheAufblähungderKeywordanzahl,umein

besseresRankingzuerzielen,keinenSinnmehr.Essolltevielmehrdaraufgeachtetwerden,inkurzen

109 Vgl.Vieregge:VielLärmumnichts:WasVoiceSearchwirklichfürSEAbedeutet

und klaren Sätzen zu schreiben, damit die Kernaussagen der Texte besser vomGoogle-Algorithmus

verstandenwerdenkönnen.110

Er argumentiert mit der Gefahr, dass Webseitenbetreiber mehrere kleine Seiten kreieren könnten,

die nur auf bestimmte Long-Tail-Keywords optimiert sind. Diese Doorway-Pages sind von Google

unerwünscht.SiewürdenzwarAntwortenaufdieFragenliefern,allerdingsseienesqualitativminder-

wertigeSeiten.DeshalbempfiehltMuellerdenEinsatzeinesVoiceCode-Snippets,welchesimQuellcode

derWebseiteeingefügtwird.Es fasstdie InformationeinerSeitezusammen, sodass sieüberSprach-

assistenten wiedergegeben werden kann.111

SokönnenFragenwie»Was sind die Neuigkeiten

der NASA« per Sprache beantwortet werden und

sind dementsprechend über Voice Search erreich-

bar.

Circa sechs Monate nach seinem Online-Inter-

view stellt Google das von Mueller erwähnte

Voice-Snippet vor. Es ist allerdings bis jetzt nur

für amerikanische und registrierte News-Web-

seiten verfügbar.112

Strukturierte Daten sind nach seiner Aussage eine

weitere Maßnahme, die ergriffen werden kann,

damit Googles Sprachassistent gezieltere Ant-

worten auf Fragen liefern kann.113 Strukturierte

Daten helfen Google dabei die Informationen

110 Vgl.JohnMueller:EnglishGoogleWebmasterCentraloffice-hourshangout.GoogleWebmasters.2018

111 Vgl.ebd.

112 Vgl.SusanneGillner:Googlepräsentiert»Speakable«:WebseitenfürdenAssistantoptimieren. InternetWordBusiness.2018

113 Vgl.JohnMueller:EnglishGoogleWebmasterCentraloffice-hourshangout

Abb. 8: Strukturierten Daten auf einer Webseite am

Beispiel eines Restaurants

56 57Voice Search

einerWebseite besser zu verstehen. Diese Daten werden dem Quellcode derWebseite hinzugefügt,

sodass Google die zusammengefassten Informationen ohne Probleme lesen kann (Abb. 8).114

AufderBasisdieserDatenerstelltGoogleunteranderemspezielleSnippets,diedirektaufdenSuch-

ergebnisseiten angezeigt werden. Diese sogenannten Featured Snippets liefern zum Teil schon die

AntwortderFrage,ohnedassaufeinSuchergebnisgeklicktwerdenmuss(Abb.9).115

Bezogen auf Voice, würde das

Vorlesen dieser Informationen

allerdings nicht bedeuten, dass

der Suchende auch die Webseite

besucht und eine Conversion –

also eine bestimmte Aktion aus-

löst.SobalderdieAntwortauf

seine Frage bekommen hat,

gibt es für ihn keinen Grund mehr die Webseite zu besuchen. Dieses Problem bestand allerdings schon

früher,alsGoogledieFeaturedSnippetseinführteundwirdwohlauchnichtdurchVoiceSearchgelöst

werden.116

Esmuss also ein Zwischenweg gefundenwerden, dieAntworten so zu formulieren, dass derNutzer

trotzdemnochInteressehat,diezitierteWebseitezubesuchen.

DerGoogleAssistantversuchtdiesesProblemzulösen,indemerdiezitierteQuellenennt:

Nutzer: Wie putze ich meine Brille richtig?

GA: Laut Mr. Spexs: Das Wasser sollte lauwarm sein, um die Beschichtung der

Gläser nicht zu beschädigen…

114 Google:IntroductiontoStructuredData.Google.2017

115 Vgl.ebd.

116 Vgl.Barrenbrügge:TheDivineVoice-DiegöttlicheStimme?–TeilEins

Mit der Phrase »Laut Mr. Spexs«,gibtGoogledemNutzerdieMöglichkeitdieseSeiteaufzurufen,um

weiterführende Informationen zum Thema zu bekommen.

Zusammengefasst ist für Unternehmen die Suchmaschinenoptimierung im Voice Search ein erster und

wichtiger Einstieg in das Thema Sprachassistenten. So lässt sich mit geringem Aufwand die Markt-

präsenz über die Sprachsuche verbessern. Zur Interaktion mit dem Kunden sind eigene Sprachanwen-

dungenerforderlich,derenKonzeptionimFolgendenerläutertwird.

Abb. 9: Featured Snippet auf Googles Ergebnisseite bei der

Suchphrase: »Wie putze ich meine Brille?«

KONZEPTION

III

60 61KonzeptionelleVorüberlegungenfüreineeffektiveSprachanwendung

10. Konzeptionelle Vorüberlegungen für eine effektiveSprachanwendung

Inihrem2004erschienenWerkschriebenCohen,GiangolaundBaloghüberVoiceUserInterfaces,die

über dasTelefonmit seinenNutzern interagieren.Damals dachtennur diewenigstendaran,wie sich

Sprachassistenten in den kommenden Jahren entwickeln würden. Obwohl ihr Werk mittlerweile 14 Jahre

alt ist,beschreibtesdochsehrgutdiekonzeptionellenVorüberlegungen,diebeidenPlanungeneiner

Sprachanwendung im Marketing notwendig sind. Deshalb soll ihr Schriftwerk im folgenden Kapitel bei

der Planung von modernen Sprachinterfaces herangezogen werden.

ZurKonzeptioneineseffektivenVUIssindimVorfelddiefolgendenPunktegenaustenszuanalysieren:

- Businessziele

- Nutzer und deren Verhalten

- Inhalt der Anwendung

So kann dieAnwendung denNutzer zufrieden stellen, ein hohesEngagement erzielen und somit ihr

Zielerreichen.Wirdnichtdaraufgeachtet,bestehtdieGefahr,dassdasVoiceUserInterfaceaufwendig

geändert werden muss oder es im schlimmsten Fall ein Misserfolg wird.117

ImFolgendenwerdenFragengestellt,diefüreineerfolgreicheKonzeptionundGestaltungbeantwortet

werden müssen.

117 Vgl.Cohen,GiangolaundBalogh,S.45

10.1. DefinitionderBusinessziele

Zuerst ist zu klären, welche Motivation oder welchen Mehrwert die Marke mit der Entwicklung

einerSprachanwendungverfolgt.Dieskönnenz.B.Kostenreduzierungensein,umPersonal-oderandere

Werbekosten einzusparen.

Ersetzt oder ergänzt eine Sprachanwendung beispielsweise den Kundenservice einer Versicherung,

so werden Servicemitarbeiter von standardisierten Anfragen entlastet.

DarüberhinauskönntedurcheinVoiceinterfaceeinkomplettneuerServiceetabliertwerden.Sokann

z.B. Ebays Sprachanwendung auf Zuruf den Wert für gebrauchte Gegenstände ermitteln.118

WennesmitderSprachanwendungeinezweiteMöglichkeitgibtaufdenServicezuzugreifen,wiedie

VerfolgungvonPaketsendungenperSpracheundLink,sosolltegenaugeprüftwerden,wasandemVUI

besser ist als an der bisherigen Schnittstelle zum Kunden.

BeiderAusgestaltungderAnwendungistdaraufzuachten,dassdieArtderStimmeunddasDesigndes

Dialoges zum Produkt bzw. Service passen muss. Das Image der Marke und die Zufriedenheit der Nutzer

sinddabeiimFokuszuhalten.IstdasNutzerziel,möglichstvieleInformationenzuerhalten,soisteine

lückenlose Informationswiedergabe ohne viele Interaktionen erforderlich.

Zu guter Letzt muss der potenzielle Kunde auf die Sprachanwendung aufmerksam gemacht werden.

Auchhierfürmussgeklärtwerden,überwelcheKanäleundinwelcherFormdiesameffektivstenge-

währleistet werden kann.119

118 Vgl.RichardNieva:GoogleHomeandeBaycantellyouhowmuchthat‘sworth.Cnet.2017.

119 Vgl.Cohen,GiangolaundBalogh,S.46–48.

62 63KonzeptionelleVorüberlegungenfüreineeffektiveSprachanwendung

10.2. Nutzer- und Nutzungsverständnis

Neben den Businesszielen ist auch das Wissen über den Nutzer und dessen Verhalten eine wichtige

Voraussetzung,umeineeffektiveSprachanwendungzuerstellen.

DerfolgendeAbschnittwirdsichdaherinzweiBereicheaufteilen.DemNutzerprofil,welchessichmit

denAnwendernbeschäftigenwirdunddemNutzungsprofil,indemesumdieFragegehtwiedieSprach-

anwendung bedient wird.

10.2.1. Nutzer

Alserstesistzuklären,wermitderSprachanwendungerreichtwerdensoll.DaransinddieReaktionen

unddasVerhaltenderAnwendung anzupassen.Spricht dieZielgruppe einenAkzent oderDialekt, so

kannesangenehmerfürsiesein,wennderSprachassistentmitdemselbenAkzentantwortet.Genauso

verhält es sich mit dem Sprachstil. Abhängig von der Zielgruppe ist es z.B. sinnvoll in Fach- oder

Jugendsprache zu antworten.

Eskannsogarvorteilhaftsein,beiunterschiedlichenZielgruppenparalleleAnwendungenfürdasgleiche

Produkt anzubieten.Dies kann dieBeratung zu einerVersicherung oderBankdienstleistung sein, die

unterschiedliche Altersgruppen ansprechen soll.

UnterschiedlicheGestaltungsmöglichkeitenergebensichauch,wenndieNutzerbereitsmitderBedie-

nung von digitalen Assistenten vertraut sind. Entsprechend müssen gelernte Befehle und Verhaltens-

weisennichtmehrSchrittfürSchritterklärtwerden.GenaudiesmussbeiNutzernbeachtetwerden,die

bishernichtmitderNutzungdieserGeräteinBerührunggekommensind.GeradedieseNutzerkönnten

eventuellhöhereErwartungenbesitzen,alsdieHeavy-User,diemitdenVerhaltensmusternvonSprach-

assistenten bereits vertraut sind.

Die hohen Erwartungen liegen darin begründet, dass neue Nutzer mit dem Sprachassistenten häufig

einen realenMenschen assoziieren. Es ist alsowichtig, gerade amTelefon, frühzeitig klarzumachen,

dass es sich um ein Bot handelt.

SoempfiehltauchGooglesInteractionDesignerinMargaretUrbanzuBeginneinerSprachanwendung

eineArt erklärende virtuelle Tour durch dieAnwendung anzubieten. Sie begründet dies damit, dass

imKörperdesNutzersGlückshormoneausgeschüttetwerden,wenneinSprachbefehlerfolgreichaus-

geführtwurde.Esseialsosinnvoll,demNutzergleichzuBeginnzuzeigen,wieerdieAnwendungrich-

tig zu bedienen hat.120

Diese Vorgehensweise wurde durch die Anfang 2018 durchgeführt Studie von Facit Digital in Koope-

rationmit derVoiceUser ExperienceAgenturVUI.agency, bestätigt. Probanden ohne Erfahrungmit

Sprachassistenten wurden in zwei Gruppen aufgeteilt. Die eine Gruppe bekam eine virtuelle Tour durch

dieAnwendung,dieanderenicht.

97%derTeilnehmer,ohneHilfestellung,hättendiesebegrüßt.VonderanderenGruppewarenfast60%mit

der bereitgestellten Hilfestellung zufrieden oder hätten eher mehr davon gewünscht. Für eine gute User

Experience bei einer Sprachanwendung ist also eine geführte Einweisung erforderlich. Patrik Esslinger

empfiehltallerdings,einemitderZeitabnehmendeAnzahlanHilfestellungen,umdenNutzernichtzu

nerven.121

10.2.2. Nutzung

Neben dem wer ist auch das wie eine entscheidende Frage, um ein gutes Zielgruppenverständnis zu

erhalten. Denn je nachdem wo, wann und warum der Nutzer mit der Sprachanwendung interagiert,

ergeben sich neue Paradigmen hinsichtlich der Anforderungen an die Anwendung. Wird sie z.B. im Auto

genutzt,musssowohlderInput,alsauchderOutputgegendieVerkehrsgeräuscheankommen.Wirdsie

120 Vgl.Pearl,S.19–20

121 Vgl.ChristianBopp:UserExperiencebeiVoiceUserInterfaces–EineTagebuchstudieamBeispielAmazon Echo.Facit.2018

64 65KonzeptionelleVorüberlegungenfüreineeffektiveSprachanwendung

zuHausegenutzt, sprichtderNutzereherüberprivateDinge,alswennersich imöffentlichenRaum

befindet.

Ebensowichtigistes,denGrundfürdieAnwendungzukennen–wirdeinkonkretesZielverfolgt,oder

möchtederNutzernurunterhaltenwerden?

DesWeiterenistzuberücksichtigen,wiesehrdieKonzentrationdesNutzersaufderAnwendungliegt.

WirdsiewährenddesKochensoderAutofahrensausgeführt,sosolltesiekürzereundkonkretereInfor-

mationen liefern,alswennderFokusausschließlichaufderAnwendungliegt.Somit istderGraddes

Multitaskings während der Nutzung ein entscheidender Faktor für das spätere Design.

Auch dieDauer undHäufigkeit, der zu erwartendenNutzung der Sprachanwendung, ist bei derGe-

staltungzubeachten.WerdenAnwendungennurseltengenutzt,empfiehltessich,dassdieAnwendung

wieder mit einer Einführung startet.

BeimehrfacherNutzunghingegen,könntedieAnwendungdenaktuellenNutzerstandspeichern,ähnlich

wie beispielsweise bei einer unterbrochenen Bestellung. Eine Zwischenform der beiden Varianten ist auch

denkbar, sodass bestimmte persönliche Einstellungen bei der folgendenNutzungwieder aufgegriffen

werden.122

BeieinemkonkretenAnwendungsbeispielmussalsovorherdurchdachtwerden,fürwendieAnwendung

erstelltwirdundwiesichderNutzerverhaltenwürden.DieseÜberlegungenbildendieGrundlagederzu

entwickelndenSprachanwendungundsolltengroßenEinflussaufdiesehaben.

10.3. Inhalt der Anwendung

BevoresindiekonkreteUmsetzunggeht,musszunächstermitteltwerden,welcherInputvomNutzer

erforderlichist,sodassermitderAnwendungzufriedenistundmitdenrichtigenInformationenversorgt

wird.Dabeiistesnotwendig,diejeweiligenFragensoprägnantzuformulieren,dassdieAntwortendes

122 Vgl.Cohen,GiangolaundBalogh,S.48–51

Nutzersmöglichstkonkretundeindeutigausfallen.DieTechnologie istzwarmittlerweile inderLage

InformationenauchausstarkverschachteltenSätzenzuextrahieren,wiederdigitaleAssistentHound

zeigt. Allerdings ist es für Menschen unnatürlich in langen komplizierten Sätzen zu sprechen. Deshalb

sollte ihnen die Sprachanwendung entgegenkommen und geschlossene Fragen stellen, auf die kurz

geantwortet werden kann.123 Die Anzahl dieser Fragen sollte zudem auf das absolut Notwendigste redu-

ziertwerden,umdenNutzernichtunnötigzubelästigen.124

NebenderInformationsbeschaffungistaucheinAugeaufmöglicheFragendesNutzerszuwerfen.Es

sollteimVorfeldüberlegtwerden,wasderNutzerfragenkönnteundwiedieSprachanwendungentspre-

chend zufriedenstellend antworten kann.

DesWeiteren kann mit einbezogen werden, ob es externeAnwendungen gibt, die mit der Sprach-

anwendungverbundenwerdenkönnen.Wenndiesebereits nützliche InformationenüberdenAnwen-

derenthalten,somussdieAnwendungdiesenichtmehrerneuterfragen,sondernkannaufdasexterne

Nutzerkonto zugreifen. Zum Beispiel nutzt der Alexa Skill von Lieferando die Angaben zum Lieblings-

essenderNutzer,dasseparatüberdieHandy-Appeingegebenwirdund imLieferando-Kontogespei-

chert ist.AlexakenntalsobereitsdasGericht,dasderNutzerbestellenmöchte,wennernachseinem

Lieblingsessen fragt.125,126

DieobenbeschriebenenVorüberlegungenbeziehensichaufspezielleVoraussetzungen,dieeineSprach-

anwendung erfüllen sollte. Allerdings ist bereits ein allgemeines Verständnis des Verhaltens und der

Probleme des Nutzers von Vorteil, wenn es um die Entwicklung einer mehrwertbietenden Sprach-

anwendung geht.127

123 Vgl.Pearl,S.159

124 Vgl.Cohen,GiangolaundBalogh,S.48–50

125 Vgl.Liferando:EssenbestellenmitAmazonAlexa-derLieferando.deSkill.2017

126 Vgl.Cohen,GiangolaundBalogh,S.53–54

127 Vgl.ebd.,S.4

66 67Reduzierung des kognitiven Aufwands

11. Reduzierung des kognitiven Aufwands

Nachdem sich das vorangegangene Kapitel mit den Vorüberlegungen beschäftigt hat, wird nun auf

konkrete Maßnahmen eingegangen, die ergriffen werden können, um der größten Schwäche einer

Sprachanwendung,denfehlendenvisuellenInformationen,entgegenzuwirken.

JedesUserInterfacebeanspruchtdiekognitivenFähigkeitenseinesBenutzers.DieseFähigkeiten,wie

Wahrnehmung,Aufmerksamkeit,Merkfähigkeit und dasTreffen vonEntscheidungen sind jedoch nur

begrenzt verfügbar.

Bei sprachbasierten Interfacen ist die Beanspruchung des kognitiven Denkens besonders groß. Die

dargestelltenInformationensindnichtstetigaufdemBildschirmzufinden,sondernstehennurkurzzur

Verfügung und müssen folglich schnell nacheinander aufgenommen werden.

DiesesKapitelwirdeinenÜberblickderMöglichkeitengeben,umeinVUIsointuitivwiemöglichzu

gestalten.128

11.1. Konsistenter Aufbau

DieKomplexitätderSprachanwendungkanndurcheinenkonsistentenAufbaureduziertwerden,umso

die Benutzerfreundlichkeit des VUIs zu verbessern.

DieskannunteranderemdurchdaskonstanteEinsetzenvonBedienelementengeschehen.EinzelneWör-

ter wie »Hilfe« und »Wiederholen« können dabei als universelle Sprachbefehle genutztwerden.De-

renFunktionsweisemussunabhängigvomZeitpunkt,andemsiegenanntwerden,immerdieselbesein.

JenachAnwendungsfallkannesunterschiedlicheuniverselleKommandosgeben.Essollteneinfache,

128 Vgl.ebd.,S.119

kurzeBegriffesein,dieleichtzumerkensind.ZudemistessinnvollnichtzuvieleverschiedeneKom-

mandoszuzulassen,umeineÜberforderungdesNutzerszuvermeiden.

DieseSprachbefehlesolltendemNutzergleichzuBeginndererstenAnwendungvorgestelltwerden,um

früh eine Vertrautheit herzustellen.

In einem grafischenUser Interface,wird für Buttons, die dieselbenAktionen ausführen, ein einheit-

licherLookgewählt.ÜbertragenaufSprachanwendungenbedeutetdies,dassauchdasAusführenvon

ähnlichen Prozessen durch eine einheitliche Folge von Sprachbefehlen geschehen muss. Dabei ist es

unabhängig,obessichumdasNavigierendurchSpeisepläneoderZugverbindungenhandelt.

DesWeiterenistderEinsatzvonMetapherneininteressanterWeg,umdieKomplexitäteinerSprachan-

wendungzureduzierenundderenContextzuverdeutlichen.Ähnlichwieder»Schreibtisch« eines Com-

puters oder der »Warenkorb« im Onlineshop erleichtern diese das Verständnis für die Zusammenhänge.

Ein gutes Beispiel hierfür liefert eine Studie der britischen Telekom von 1999. In dieser Studie wurden

denProbandendreiverschiedeneTeleshopping-Möglichkeitenpräsentiert.DerEinkaufwarsowohlüber

eineMenüstruktur,einKatalogsystemalsauchübereineWarenhaus-Metaphermöglich.Indiesemvir-

tuellenLadenwurdenTür-,Kassen-undsogarFahrstuhlgeräuschesimuliert.DergrößteTeilderTeil-

nehmerempfanddiesealsdasangenehmsteEinkaufserlebnis.Darüberhinauswaresauchdaseffektivste.

Der gezielte Einsatz von Metaphern erweitert das VUI um die visuelle Komponente im Kopf des

Nutzers.129

129 Vgl.ebd.,S.119–24

68 69Reduzierung des kognitiven Aufwands

11.2. Aufbereitung der Informationen

NebendemkonsistentenAufbauhatauchdieArtderInformationsaufbereitungeinenwichtigenEinfluss

auf die User Experience des Voice User Interface.

Im Verlauf der Arbeit wurde bereits die »Millersche Zahl«erwähnt,diebesagt,dassderMenschnicht

inderLageist,mehralssiebenDingeinseinemKurzzeitgedächtniszubehalten.Hierbeimussbetont

werden,dassesjedochdeutlichanspruchsvollerist,einemSprachassistentenzuzuhören,alsindenvon

GeorgeMillerdurchgeführtenVersuchen.DennnebendemErinnernandieSätzedesAssistenten,muss

derNutzerauchdiefür ihnrelevantenInformationenherausfilternundzusätzlichaufgestellteFragen

reagieren.

Experimenteindenfrühen2000erJahrenhabengezeigt,dassPersonen,diemiteinemSprachassistenten

interagieren, sich maximal vier verschiedene Informationseinheiten merken konnten. Dies lässt den

Rückschlusszu,dassAuswahlmenüsineinerSprachanwendungnichtmehralsdreibisvierverschiedene

Elementebeinhaltensollten,umeineNutzerüberforderungzuvermeiden.

EineweiteremöglicheÜberforderungdesAnwenderskanndurchdieNutzungdesRezenzeffektverrin-

gertwerden.DiesesPhänomenbeschreibt,dassInformationenbesserwahrgenommenwerden,wennsie

am Ende eines Satzes genannt werden.

In ihrem Buch »Voice User Interface Design« nennen die Autoren folgendes Beispiel:

»Um das Gesagte noch einmal zu hören, sage ›Wiederholen‹« seibesser,als

»Sage ›Wiederholen‹, um das Gesagte noch einmal zu hören.«

BeidererstenEingabeaufforderungwirddieentscheidendeInformationamEndegenanntundentspre-

chend besser behalten, als bei derZweiten.DieseMethode lässt sich auch auf andere Informationen

übertragen,diefürdenNutzervonBedeutungsindundandieersicherinnernsoll.130

130 Vgl.ebd.,S.125–29

Sprachanwendungen werden häufig neben anderen Tätigkeiten, wie Hausarbeit oder Autofahren,

bedient.Es istdahervonentscheidenderBedeutung,dasseineAnwendungsowenigAufmerksamkeit

wiemöglichinAnspruchnimmt.DafürsinddierelevantenInformationendemNutzermöglichstkurz

und präzise zugänglich zu machen. Weitere Details sollten erst zu einem späteren Zeitpunkt wieder-

gegeben werden.

Geschiehtdiesnicht,soistderNutzermitdergroßenMengeanInformationenüberfordert,wiefolgendes

Beispiel zeigt:

Alexa: Wo soll es los gehen?

Nutzer: Braunschweig.

Alexa: Dein Start ist Braunschweig. Was ist dein Ziel?

Nutzer: München

Alexa: Dein Ziel ist München. Wann möchtest du fahren?

Nutzer: Heute 16 Uhr

Alexa: Es gibt zwei Verbindungen von Braunschweig Hauptbahnhof nach München

Hauptbahnhof um 16 Uhr. Erste Verbindung planmäßige Abfahrt um 15 Uhr

34 heute voraussichtlich erst um 15 Uhr 43 mit ICE 16 99 ab Gleis 6. An

kunft um 22 Uhr. Zweite Verbindung planmäßige Abfahrt um 16 Uhr 59 mit

ICE 877 von Gleis 7. Du musst einmal in Göttingen umsteigen. Kann ich dir

sonst noch weiterhelfen?

Nutzer: Stopp.

70 Reduzierung des kognitiven Aufwands

AnstattdenNutzermitDetailszuüberfordern,diezudiesemZeitpunktnochuninteressantsind,könnte

die Sprachanwendung zuerst nur die Verbindungen aufzählen:

Alexa: Alles klar, dein Ziel ist München. Wann möchtest du fahren?

Nutzer: Heute 16 Uhr.

Alexa: Es gibt zwei Verbindungen nach München: um 15: 43 und 16:59 Welche

möchtest du nehmen?

Nutzer: Die erste

Alexa: Um 15:43 startet der ICE 1699 auf Gleis 6. Ankunft in München um 22 Uhr.

Du musst einmal in Göttingen umsteigen.

Möchtest du weitere Infos zu dieser Verbindung aufs Handy geschickt

bekommen?

EntsprechenddiesemPrinzipwerdendieInformationenzunächstaufdasabsolutNötigstereduziertund

demNutzerpräsentiert.JenachZielgruppekannvariieren,welcheInformationenfürsierelevantsind.

Wählt derNutzer nun einElement aus, so können detailliertere Informationen folgen.Dadurchwird

seineAufmerksamkeitsspannenichtmitInformationenstrapaziert,diefürihnnochnichtvonBedeutung

sind.131

131 Vgl.ebd.,S.129–31

72 73Use Cases für Sprachanwendungen im Marketing

12. Use Cases für Sprach- anwendungen im Marketing

Aus Marketingsicht ist der Blick in die der Top-Ten-Liste der Alexa Skills relativ ernüchternd. Die mei-

stenSkillsdieserListewurdenvonprivaten,unabhängigenEntwicklernerstellt, derenAnwendungen

keineMarketingambitionenhaben.AufdenvorderenPlätzenfindensichSkillswie»Pupsgenerator« und

»Katzengeräusche«,sowie»Empfangsdame«,derBesuchermiteinemlaunigenSpruchwillkommenheißt.

Nur zwei Unternehmen mit professionellen Ambitionen konnten sich unter den ersten zehn positionie-

ren. Die ARD mit ihrer Anwendung »Tagesschau in 100 Sekunden« und der Radiosender Antenne Bay-

ern.Dieser bietet dieMöglichkeit, den Sender zu streamen und Infos zu aktuellenVerkehrslagen zu

erhalten.132

InDeutschlandgibteszwarweitereSkills,dievonbekanntenMarkenbetriebenwerden,wie»Mytaxi«,

»Deutsche Bahn« oder der Lieferdienst »Lieferando«,allerdingsscheintesso,alsobsiebisjetztnoch

keinen passenden Use Case gefunden haben. Denn diese Skills sich nicht in dem Ranking der beliebtes-

tenAlexa-Skillswiederzufinden.133

Auf dem amerikanischen Markt hingegen ist es diversen Anbietern gelungen mit Alexa-Skills Marketing

zu betreiben. Im Folgenden die interessantesten Beispiele:

- Der Skill »Tide-Stain Remover« des Waschmittels Tide wurde von dem

GroßkonzernProcter&Gambleentwickeltundliefertfürüber200Fleckenarten

einepassendeSchritt-für-Schritt-Anleitung,umihnzuentfernenundvermarket

dabei seine Produkte.134

132 Vgl.RolandEisenbrand:AmazonverrätinsgeheimdiebeliebtestendeutschenAlexaSkills. OnlineMarketingRockstars.2017

133 Vgl.ebd.

134 Vgl.Procter&Gamble:Tide–StainRemover.Amazon

- »Wine Finder«isteinSkill,umdenpassendenWeinzueinemGerichtzufinden.

Dabei schlägt es auch für einfache Gerichte wie Pizza oder Hot Dogs einen pas

senden Wein vor.135AufdieseWeisekönntenWeinebeworbenundauchverkauft

werden.

- Der Entwickler Brandon Telle entwickelte mit »Board Game Answer«einenSkill,

derdemNutzer,dieAnleitungvonBrettspielenerklärt.AufkonkreteFragenwie

»Wie viele Spieler können bei Monopoly mitspielen?« liefert Alexa eine passende

Antwort.136DieHerstellervonGesellschaftsspielenkönntenalsodieRegelnvor

und während des Spiels durch einen Sprachassistenten erklären lassen. Damit lässt

sich das Spielerlebnis steigern und die gedruckte Anleitung einsparen.

- Der Alexa Skill des Whisky-Herstellers »Johnnie Walker«istinderLage,Fragen

zuWhiskysortenzubeantworten.ErkanndurchgezielteFragenzuGeschmack,

VorliebenundPreiseinenpersönlichenWhiskyempfehlen.WennmanProdukte

erworbenhat,kannderSkilleineauthentischeWhisky-Verkostung,wieimStamm

haus durchführen.137

- Der Tierfutter-Hersteller »Purina PetCare«,entwickeltedenSkill

»Ask Purina« welcher sich nicht um die direkte Vermarktung der Produkte

kümmert,sondernNutzerneinBeratungstoolandieHandgibt,dieperfekte

Hunderassezufinden.138 Auch so lassen sich neue Kunden generieren.

135 Vgl.BloopEntertainment:WineFinder.Amazon

136 Vgl.BrandonTelle:BoardGamesAnswers.Amazon

137 Vgl.Ann-ChristinSchneider:AlexamachtVoiceContentMarketingzumneuenTrend.VoiceContent Marketing-AlexabistdudieZukunft?Xengoo.2018

138 Vgl.ebd

74 Use Cases für Sprachanwendungen im Marketing

- DerAlexaSkilldesBarbecuesoßen-HerstellersStubb,berätseineNutzerbei

Grill-RezeptenundgibtihnendieMöglichkeitSoßenperSprachezubestellen.

DasBesonderedesSkillsist,dassnichtAlexaantwortet,sondernder

Firmengründer mit seiner markanten Stimme.139

- DieGoogleActionvonEbayermöglichtesNutzerndenWertvonWarenzu

erfahren,diesieverkaufenwollen.MitgezieltenFragennachMarke,Spezifika-

tionenundZustand,nenntdieActionzuwelcherPreispannederNutzerdas

ProduktaufEbayverkaufenkönnte.140 So wird die Nutzung von Ebay erleichtert

und neue Kundengruppen erschlossen.

AllevorgestelltenSkillszeigendasMarketingpotenzialvonSprachanwendungen.Esgelingtihnen,den

Kunden einenMehrwert zu bieten und gleichzeitig dieMarken-Awareness zu vergrößern bzw. neue

Kunden zu generieren.

Allerdings ist die Nutzung von Skill noch nicht nachhaltig genug. Nach einer Studie von Voice Labs

nutztennur3%einenSkillauchinderzweitenWochenachderAktivierung. 141 Es ist noch viel in die

Content-Qualitätzuinvestieren,umdasgroßePotenzialvonSprachanwendungenfürUnternehmenzu

heben. Gerade deutsche Unternehmen haben im Vergleich zu amerikanischen einen erheblichen Nach-

holbedarf. Der amerikanische Markt ist hier viel weiterentwickelt und sollte als Vorbild fungieren.

Hiergiltes,alsdeutscheMarkenundUnternehmen,nichtdenAnschlusszuverlieren.

139 Vgl.Stubb‘sLegendaryBar-B-Q:AskStubb.Amazon

140 Vgl.Nieva:GoogleHomeandEbaycantellyouhowmuchthat‘sworth

141 Vgl.VoiceLabs:The2017VoiceReport.VoiceLabs.2017

UMFRAGE

IV

78 79Umfrage bei Kolle Rebbe

13. Umfrage bei Kolle Rebbe

Im Rahmen dieser Bachelorarbeit wurde eine Umfrage zum Thema Sprachassistenten im Marke-

ting in der Hamburger Werbeagentur Kolle Rebbe durchgeführt. Die Umfrage wird einen Vergleich

zwischen den Ansichten der Marketingexperten in der Agentur und dem Verhalten der Nutzer ziehen. Die

Aussagen der Werber werden den Daten potenzieller Nutzer aus der Online-Statistik-Plattform Statista

und anderen repräsentativenQuellen gegenübergestellt.UmdiesenVergleich besser zu verdeutlichen

wird die Hamburger Umfrage orange dargestellt, während die anderen Umfragen in blau abgebildet

werden.

DarüberhinauswardasZiel,EinblickeindieEinschätzungderMitarbeiterhinsichtlichderNutzung,des

Potenzials und der Anwendung von Sprachassistenten in der Werbung zu gewinnen.

DerOnlinelinkzurUmfragewurdeanalleknapp300MitarbeiterderAgenturgesendet,vondenenmehr

als jeder fünfte teilgenommen hat.

13.1 Allgemeine Angaben der Teilnehmer

Über 80% der Teilnehmer stammen aus den relevanten

Bereichen Kreation (42%) und Beratung (40%), wobei die

Altersgruppender20–29-jährigenmitfast50%amstärksten

vertreten war (Abb. 10).

Zur besseren Segmentierung wurde diese Alters-gruppe

nochmals aufgeteilt in die 20–25- und 26–30-jährigen,

die sich mit etwa 25% gleich verteilen. Die zweitgrößte

Altersgruppe mit 35% bilden Personen zwischen 31 und

39 Jahren, während die über 40-jährigen nur zu 14% vertreten sind. Zur Einschätzung

des Potenzials und der Nutzung von Sprachassistenten wurde eine weitere Segmentierung basierend

aufdemTätigkeitsbereichvorgenommen.DreiviertelallerMitarbeiterarbeiteninderKlassik,diesich

mitdenMedienTV,RadioundPrintbeschäftigen.DasrestlicheViertelistindendigitalenMedientätig.

Insgesamt nutzen bereits knapp 60% der Befragten einen Sprachassistenten. Damit sind sowohl

dieAssistenten auf den Voice-Only-Geräte bzw. Smartspeaker gemeint, als auch die in das Handy

integriertenAssistenten.Esfälltauf,dasseskeinesignifikantenUnterschiedeindenNutzeranteilennach

den Tätigkeitsbereichen Kreation, Beratung oder

Digital und Klassik gibt.

Anders als erwartet, werden Sprachassistenten in

der Altersgruppe der 20–25-jährigen mit nur 50%

wenigergenutzt,alsbeidenÄlteren.

Auf die Frage, ob die Werber das Medium Voice

einempotenziellenKunden empfehlenwürden, ant-

worteten etwa 74% mit »ja« – unabhängig davon,

ob sie einen Assistenten selbst nutzten oder nicht.

Dabei fällt auf, dass die Empfehlungsrate der

Sprachassistenten-Nutzer mit 76% nur marginal

größer ist als die der Nichtnutzer mit 70%. Das

links stehende Sunburst-Diagramm zeigt dies im

Überblick(Abb.11).

Abb. 10: Altersüberblick der befragten

Werber von Kolle Rebbe

20-25

26-3031-39

40-4950+

Abb. 11: Nutzung von Sprachassistenten der

Werber und deren Empfehlung als

Medium im Marketing

80 81Umfrage bei Kolle Rebbe

bei denMitarbeitern aus, die für die digitalen

Medien arbeiten. Hier ergibt sich ein Mittel von

ca. 75 mit deutlich geringerer Streuung. Nur

7%diesesSegmentshabeneinenWertunter50

ausgewählt.

In derAnnahme, dass dieAntworten normal-

verteilt sind, ergibt sich das Diagramm in

Abbildung 13, bei demman deutlich erkennt,

dass der digitale Bereich das Potenzial von

VUIs im Marketing höher einschätzt und die

Meinungen dieses Segments nicht so weit

streuen,wiebeiderKlassik.

Entsprechend den Unterschieden bei der Ein-

schätzung des Potenzials von Sprachassistenten

zwischenKlassikundDigital,findensichdiese

auch bei der Beurteilung des geeigneten Kunden-

spektrums. Aus einer Kundenliste von Kolle

Rebbe konnten die Befragten die Unternehmen

heraussuchen,welcheihrerMeinungnachdashöchstePotenzialaufweisen,eineSprachanwendungim

Marketing zu benutzen. Dabei war Mehrfachauswahl zugelassen.

Die 13 meistgenannten Kunden sind in dem obenstehendes Diagramm aufgelistet (Abb. 14). Die Mar-

ketingexpertenweisendenDienstleisternO2undNetflixdasmeistePotenzialzu.AberauchAudiund

Lufthansa liegen sehr weit vorne.

DieThese,dassDienstleistungsfirmengrößereChancenhabenMarketingmitSprachanwendungenzu

betreibenalsProduktverteiber,zeigtauchdasErgebniseinerweiterenFrage.Hierantworteten80%der

Werber,dasseineDienstleitungbessergeeignetseidigitaleAssistentenzubenutzten,alsProdukte.

DieUmfragewurdesoangelegt,dassdieBefragten,je

nachdem ob sie bereits einen Sprachassistenten nutzen

oder nicht, zu anderen Fragenweitergeleitet wurden.

Die nachfolgende Auswertung bezieht sich auf die

Mitarbeiter,diebereitseinenSprachassistentenbenutzen

(35 Personen).

DabeigehtesumdieNutzungvonThird-Party-Apps,

wie Skills oder Actions. Es sollte herausgefunden wer-

den,wiehochdieNutzungvondiesenAnwendungen

ist.Nuretwa30%nutzenSkillsoderActionshäufigeralseinmalimMonat.DerGroßteilderBefragten

nutzt die Third-Party-Sprachanwendungen gar nicht (Abb. 12).

Im weiteren Verlauf der Umfrage wurden die Mitarbeiter um ihre Einschätzung hinsichtlich der Rolle

von Sprachassistenten im zukünftigen Marketing gebeten. Dazu sollten sie auf einer Skala von 0–100 das

Potenzial markieren. Null stand in diesem Fall für »keine Rolle« und 100 für »eine sehr große Rolle«.

DieseFragewarunabhängigdavon,obsiebereitseinenSprachassistentennutzenodernicht.Miteinem

Mittelwertvonca.64schreibendieAgenturmitarbeiterdendigitalenAssistenteneinerhöhtesPotenzial

im Marketing zu. Für die beiden Medienbereiche Klassik und Digital ergeben sich nach der Auswertung

des arithmetischen Mittels aller-

dings unterschiedliche Werte.

In der Klassik liegt es bei knapp

60. Allerdings ist die Streu-

ung der Antworten sehr groß,

sodass knapp 25% der Perso-

nen, die in der Klassik arbeiten,

ihre Markierung bei weniger als

50 gesetzt haben. Anderes sieht es

Abb. 14: In welchen Kunden sehen die Werber das

meiste Potenzial gesehen.

0 10 20 30 40

O2

Netflix

Audi

Audible

Lufthansa

DAZN

Hey car

BA für Arbeit

inlingua

Enterprise

Aktion Mensch

TUI

arte

nie

alle 2 Tage

monatlich

täglich alle 2 Wochen

Abb. 12: HäufigkeitderNutzungvon

Third-Party-Apps der Werber

0 25 50 75 100

Klassik Digital

Abb. 13: Potenzialeinschätzung von Sprachassistenten im

Marketing nach Klassik und Digital

82 83Umfrage bei Kolle Rebbe

Mit der nächsten Frage wurden den

Teilnehmern verschiedene Einsatz-

möglichkeiten derAssistenten vorge-

schlagen,ausdenensiemaximalzwei

markierenkonnten.Esergabsich,dass

die meisten Personen den Bereich

»Informationen vor dem Verkauf«

auswählten. Die »Beratung« vor und

nach dem Verkauf wurde deutlich

weniger markiert. Dem Sprach-

assistenten wird scheinbar keine Kom-

petenz in der Beratung der Nutzer

zugetraut. Hingegen wird viel Poten-

zial in dem schnellen und einfachen

Informieren des Nutzers gesehen.

Zudem ist eine Unterscheidung zwischen »vor« und »nach« dem Verkauf zu erkennen. Dem Zeit-

raum »vor dem Verkauf«wirdmehrPotenzialzugesprochen,alsdemAfter-Sales.InderoberenGrafik

ist dies durch die unterschiedlichen Farben dargestellt. Im »direkten Verkauf« wird kein Potenzial für

Sprachassistenten gesehen (Abb. 15). Dies bestätigt die bereits getätigte Aussage im Kapitel »Potenziale

für Marken und Unternehmen«.

13.2. Sprachassistenten

ImVerlaufderweiterenUmfrage,wurdendieMitarbeitervonKolleRebbeumeineEinschätzungder

Zielgruppe vondigitalenAssistenten gebeten.Auf dieFrage,welcherSprachassistent, ihrerMeinung

nachamhäufigstengenutztwird,lagdieMehrzahlderAntwortenbeiAlexaundSiri,wobeiAlexaetwas

Abb. 15: Einschätzung der Einsatzmöglichkeiten von

Sprachassistenten im Marketing

häufigererwähntwurde.DerGoogleAssistantspielenureineuntergeordneteRolle,sodieWerber.Die

Sprachassistenten Bixby von Samsung und Cortana von Microsoft wurden gar nicht genannt (Abb. 17).

Diese Einschätzungen decken sich nicht mit einer im Herbst 2017 durchgeführten Online-Umfrage in

Deutschland(Abb.16).BetrachtetmandieNutzungderGeräte,soliegenbeideUmfragenweitausein-

ander.LautderdeutschlandweitenUmfrage,mitübertausendTeilnehmern,nutzennur8%derBefragten

Alexaregelmäßig.AnderssiehtesbeidemGoogleAssistantundSiriaus,diebeidefastdoppeltsooft

verwendet werden.

Die Nutzung der Sprachassistenten deckt sich jedoch nicht mit ihrem Bekanntheitsgrad, sondern

verhalten sichkonträr zueinander.Sokennen88%allerDeutschenAlexa, dochnur etwa einZehntel

davonnutztdiesenAssistentenauch.DerGoogleAssistantundSirisindweitwenigerbekannt,werden

jedochhäufigerverwendet.142

142 Vgl.SplendidResearchGmbH:DigitaleSprachassistenten

Abb. 16: Nutzung und Bekanntheit von

Sprachassistenten in Deutschland

Abb. 17: Einschätzung der Werber, welcher

Sprachassistentamhäufigstengenutztwird.

0 20 40

Alexa

Siri

GoogleAssistent

Cortana

Bixby

0% 20% 40% 60% 80%

GoogleAssistent

Siri

Cortana

Alexa

regelmäßige Nutzung ist bekannt

84 85Umfrage bei Kolle Rebbe

assistenten im Auto die meisten Nutzer vermutet

haben (Abb. 19).

Betrachtet man die deutschlandweite Verteilung

der verschiedenen Hersteller bei den Smart-

speakern genauer, so zeigt sich Amazon mit

dem Echo als absoluter Marktführer in Deutsch-

land (Abb. 20). Fast dreiviertel der 164

befragten Smartspeaker-Nutzer verwenden dieses

Voice-Only-Gerät,währendnur15%denGoogle

Homebenutzen.DieweiterenverfügbarenSmartspeakervonLenovo,SonosundSonyspielenimMarkt

nur eine untergeordnete Rolle.145

Zum Zeitpunkt dieser Umfrage war Google Home allerdings erst ein paar Monate auf dem Markt.

Zudemkonnteder,erst2018inDeutschlanderschie-

nene,HomePodvonApplekeineBerücksichtigung

finden.

AndersalsvondenWerberneingeschätzt,habennicht

Voice-Only-Geräte diemeisten Nutzer, sondern die

digitalen Assistenten auf den Handys. Das integrierte

Sprachassistenten im Auto bis jetzt noch keine

bedeutendeRollespielen, stimmtmitdenAussagen

der Marketingexperten überein.

145 Vgl.Statista:SmartSpeaker.Statista.2018

ZusammenfassendverzeichnetderSprachassistentAlexazwardiegrößteBekanntheitinderdeutschen

Bevölkerung, aber nicht die meisten Nutzer. Hier dominieren Siri und GoogleAssistant denMarkt.

Diesistvermutlichdaraufzurückzuführen,dasssichbeidevorinstalliertaufdenmeistenHandysfinden

lassen,währendAmazonkeinbekanntesSmartphonevertreibt.143

DieWerber sahen inAlexa den meistgenutzten Sprachassistenten, obwohl er nur den Bekanntesten

darstellt.

13.3. Sprachbasierte Geräte

Die Nutzerverteilung von sprachbasierten Geräten aus einer deutschlandweiten Umfrage

von 2018 mit 1.600 Befragten zeigt, dass 58% digitale Assistenten auf ihrem Smartphone

nutzen (Abb. 18). Damit ist das Handy mit Abstand das meistgenutzte Endgerät. Hingegen nutzen

nur etwa 17% einen Sprachassistenten auf Voice-Only-Geräten bzw. Smartspeakern. Eine

noch geringere Nutzungsquote haben die Sprach-

assistenten, die in das Infotainmentsystem von

Fahrzeugen integriert sind.144

Hier stimmen diese Aussagen nicht vollständig

mit denEinschätzungen derWerber überein, von

denen 45% vermuten, dass Voice-Only-Geräte

wie Amazon Echo oder Google Home die meisten

Nutzer besitzen würden. Etwas seltener markierten

sie Sprachassistenten in Smartphones, während

nur etwa 20%, bei den integrierten Sprach-

143 Vgl.Heuzeroth:KriegderSprachassistenten

144 Vgl.Statista:MitwelchenGerätenhabenSieschoneinmaleinenSprachassistentengenutzt?Statista.2018

Abb. 19: häufigstesNutzungsgerätnachMeinung

der Werber.

0 10 20 30

Voice-Only

auf dem Handy

im Auto

0% 20% 40% 60% 80%

Amazon Echo

Google Home

Lenovo SmartAssistent

Sonos One

Sony LF-S50G

Abb. 20: Nutzung von Smartspeakern in

DeutschlandAbb. 18: Nutzung nach Gerät in Deutschland

0% 20% 40% 60%

Smartphones

Tablets

PC/Laptop

Voice-Only

Auto

Smartwatch

86 87Umfrage bei Kolle Rebbe

13.4. Altersgruppen

DieMarketingexpertenkonnteninderUmfragezweiAltersgruppenmarkieren,dieihrerMeinungnach

am besten mit Werbung über Sprachassistenten zu erreichen sind. Die Meisten von ihnen gaben die Ziel-

gruppe der 20- bis 39-jährigen als die relevanteste Gruppe an. Die Wenigsten sahen in der Zielgruppe der

über59-jährigendasgrößtePotenzial(Abb.21).

Eine2017inÖsterreichdurchgeführteUmfragezeigt,dassdieVerteilungderNutzerindenverschiedenen

Altersgruppenandersist,alsdieWerberdiesvermutethaben.

LautderösterreichischenUmfragesinddie14–19-jährigendieAltersgruppe,dieamhäufigstenSprach-

assistentennutzten(40%).AuchindieserUmfragezeigtsich,dassdieüber59-jährigen,mit22%die

wenigsten Nutzer vorzuweisen haben (Abb. 22).146

146 Vgl.BarthundCerny,S.12

In Bezug auf das Einkommen der verschiedenen Altersgruppen liegt die Einschätzung der Hamburger

Werber nicht schlecht. Denn die unter 20-jährigen haben in Deutschland das geringste Einkommen

und entsprechend auch die geringsteKaufkraft. Das höchste Einkommen findet sich bei den 45–50-

jährigen.147,148 Aus diesem Grund ist die Ausweitung der geeignetsten Zielgruppe auf die 20–39-jährigen

durch die Marketingexperten von Kolle Rebbe eine durchaus realistische Einschätzung.

Sie sollten jedoch trotzdem weder die 14–19-jährigen als Hauptnutzer von Sprachassistenten vernachläs-

sigen,nochdiewachendeZielgruppeder60-plus-Generation.

13.5. Nutzungsort

Hinsichtlich der Frage, ob Sprachassistenten in den eigenen vier Wänden oder unterwegs häufiger

genutzt werden, decken sich die Aussagen der Hamburger Umfrage mit vergleichbaren Statistiken

aus anderen Quellen. Die meisten der befragten

Personen nutzen ihre Sprachassistenten im

privaten Umfeld. Nur sehr wenige Nutzer,

sprechen mit den digitalen Assistenten in der

Öffentlichkeit, inBusbzw.Bahnoder inGemein-

schaftsbüros (Abb. 23). Dies ist aller Voraussicht

auf die, bereits in der SWOT-Analyse erwähnte,

fehlende Privatsphäre zurückzuführen, die die

Nutzer daran hindert, persönliche Informationen

verbal zu teilen. Die amerikanische digital Agentur

147 Vgl.Statista:DurchschnittlicherBruttojahresverdienstderArbeitnehmerinDeutschlandnachAlters gruppenimJahr2010.2010

148 Vgl.Statista:AnteilderKaufkraftderDeutschennachAltersgruppen

Abb. 21: Geeignetste Altersgruppe für Sprach-

assistenten nach Einschätzung der

Werber

Abb. 22: Nutzer von Sprachassistenten nach

Alter in Österreich

0 20 40 60

14-19

20-39

40-59

60+

0% 10% 20% 30% 40%

14-19

20-39

40-59

60+

Unterwegs

zu Hause

Abb. 23: Einschätzung, an welchem Ort Sprach-

assistentenamhäufigstengenutztwerden

88 89Umfrage bei Kolle Rebbe

Stone Temple Consulting konnte jedoch in einer Umfrage von 2018 eine Veränderung dieses Verhaltens

im Vergleich zum Vorjahr feststellen. Laut deren CEO Eric Enge werden die Nutzer immer aufgeschlos-

sener,SprachassistentenimöffentlichenRaumzunutzten.DieUmfragewarallerdingsaufdenamerika-

nischen Raum beschränkt.149EinemöglicheÜbertragungaufdeutscheNutzerbleibtoffen.

13.6. Potenzial im Marketing

AufgrunddesverzweigtenAufbausderUmfrage,wurdendieEinschätzungenzumMarketingpotenzial

ausschließlichdenKolleRebbeMitarbeiterngestellt,dieeinenSprachassistentennutzen.Jenachdem,

ob sie den Einsatz von Sprachassistenten einem potenziellen Kunden empfehlen würden oder nicht,

wurdenanschließendgetrenntnachdenGründenbefragt.

Dabei hatten Teilnehmer bei den genannten

Fragen die Möglichkeit je zwei Antwort-

möglichkeitenzumarkieren.

DiemeistenMitarbeiter, die den Einsatz von

Sprachassistenten empfehlen würden, nann-

ten Innovation als Hauptargument (Abb. 24).

EineÜbersichtderAntworten,istindemunten

stehenden Diagramm zu finden. Über die

Möglichkeit der freien Texteingabe wurden

mit »Barrierefreiheit« und »Kundenbindung«

zwei weitere gute Argumente genannt.

Als Hauptargument der Teilnehmer, die

den Einsatz von digitalen Assistenten in der

149 Vgl.EricEnge:31MustKnowMobileVoiceUsageTrendsfor2018.StoneTempleConsulting.2018

Werbungnichtempfehlen,wurdeeinezuge-

ringeGrößederZielgruppegenannt(Abb.25).

Zu guter Letzt wurden die Werber nach den

GeschäftsfeldernmitdemhöchstenPotenzial

für Sprachassistenten befragt. Diese Frage

konnte in einem freien Textfeld beantwortet

werden.

AmhäufigstenwurdenServicedienstleistun-

gen, wie Finanz- und Informationsdienste

genannt. Etwas seltener wurde die Auto-

mobilbranche und der Entertainmentbereich

aufgeführt.

13.7. Zusammenfassung der Umfrage

Die Umfrage liefert ein recht unterschiedliches Meinungsbild der Werber. Einige sehen sehr viel

Potenzial indemneuenMedium,anderesprechendendigitalenAssistentenkaumeineBedeutung im

Marketingzu.Diesunterstreichtauchdas letzte, freieAntwortfeldderUmfrage, indasdieBefragten

offenihrepersönlicheMeinungzudemThemaSprachassistentenimMarketingäußernkonnten.Zwar

teilten die meisten den virtuellen Assistenten eine nicht zu vernachlässigende Bedeutung im Leben der

Konsumentenzu,warensichjedochbezüglichderAnsichtenzumNutzenimMarketinguneinig.

Ausgelöst durch diese Umfrage wurde das Thema Sprachassistenten imMarketing bei Kolle Rebbe

intensivdiskutiert.Eszeigtesich,dasshierweiterer InformationsbedarfundpraktischeAnwendungs-

fälle notwendig sind, um die Nutzer und deren Verhalten besser einschätzen zu können. Diese

Kenntnisse sind jedoch unabdingbar für die Entwicklung von zielgruppenorientierten und mehrwertbie-

Abb. 24: Pro-Argumente

0 5 10 15 20

Innovation

bessererKundenservice

Schnelligkeit

natürlicheKommunikation

Emapthie

Nähe der Zielgruppe

andere

Abb. 25: Contra-Argumente

0 1 2 3 4

Zielgruppe zu klein

Entwicklungsstand

seltene Nutzung

fehlendeMarketingstudien

unpraktisch

es werden kaum Skillsgenutzt

90 91Umfrage bei Kolle Rebbe

tenden Sprachanwendungen angesehen.

Inwieweit mit dieser bei Kolle Rebbe durchgeführten Umfrage auf die Gesamtheit der deutschen

Werbeagenturengeschlossenwerdenkannistfraglich,dadieUmfragedafürmit64Teilnehmernnicht

repräsentativ ist.

EinedetaillierteAuswertungderUmfrageistimAnhangzufinden.

92 93Fazit

14. Fazit

VoiceUserInterfacebietenseinenNutzernvieleVorteile,dasieschnellerundintuitiverzubedienensind

als vergleichbare Mensch-Computer-Schnittstellen. Allerdings bedeutet dies im Gegenzug nicht zwangs-

läufig,dassderenNutzungauchfürdasMarketingsinnvollist.IhrEinsatzmachtnurdannSinn,wenn

sie dem Anwender einen realen Mehrwert bieten und nicht auf den ersten Blick als Werbung zu erkennen

sind.

UmdiesenMehrwertzuerreichen,istbeiderKonzeptioneinerSprachanwendungdiegenaueKenntnis

derZielgruppeunabdingbar.Ichbehauptesogar,dasssiewichtiger ist,alsbeieinervisuellenAnwen-

dung.DenndieNutzungderSprache folgt keinen explizit erlerntenBedienelementen,wiebei einem

grafischenNutzerinterface.SieistintuitiverundvonMenschzuMenschunterschiedlich.Deshalbmuss

die Sprachanwendung genausten auf das Verhalten der Zielgruppe ausgerichtet werden.

Sollte keinMehrwert für dieNutzer gefundenwerden, so ist ihr Einsatz für dasUnternehmen nicht

sinnvoll.

Generell ist ein Umdenken bei der Gestaltung von sprachbasierten Anwendungen erforderlich. Es gibt

kein Wo, sondern nurWann und Wie der Nutzer die Informationen wahrnimmt. Wobei sich das Wie

ausschließlichaufdieArtundWeisederStimmebezieht.DiesschränktdieGestaltungsmöglichkeiten

erheblichein,eröffnetabergleichzeitigauchneueund interessanteMöglichkeitendieMarkeunddas

Unternehmen auditiv wahrzunehmen.

ZielderArbeitwares,eineAntwortaufdieFragezufinden,obSprachassistentenPotenzialhabenim

MarketingEinsatzzufinden.

DieAntwortlautet:Ja,habensie,allerdingsnurbedingt.

Meiner Meinung nach ist der direkte Verkauf von Produkten oder Dienstleitungen über digitale Assis-

tentenkaummöglich.VielgrößereChancenhabenSprachassistentenimBereichMarken-Awareness,da

hier die Marke mit einer mehrwertbringenden Anwendung verbunden werden kann.

VorgutzehnJahrenkamdasiPhoneaufdenMarkt.EinsehrteuresTelefon,dasdamalskaummassen-

tauglich erschien. Wie wäre damals eine Umfrage zum Thema »Chancen und Risiken von Smartphones

im Marketing«ausgefallen?Wahrscheinlichhätteniemandvorhergesagt,dassdieseinmilliardenschwe-

rer Markt werden würde. Heute stehen wir mit der Entwicklung von Sprachassistenten auf derselben

Entwicklungsstufe und führen die gleiche Diskussion mit ähnlichen Argumenten.

Die Technologie der digitalen Assistenten steckt noch in den Kinderschuhen. Sie lernt jedoch stetig dazu

und wird von Tag zu Tag besser. In weniger als zehn Jahren wird sie erwachsen und ein fester Be-

standteilunsererGesellschaftsein.EsistalsoeinMussfürjedewerbungtreibendeMarkeundAgentur,

sichschonjetztindenfrühenJahrenmitihrzubeschäftigen.HeutekönnensiedieArtundWeisewie

MarkenkommunikationaufSprachassistentenaussehenwirdnochmitgestalten,Erfahrungensammeln

und neue Wege einschlagen.

BegonnenhabeichmeineBachelorarbeitmiteinemderbekanntestenundeinflussreichstenScience-Fic-

tion-FilmeallerZeiten.DahermöchteichmiteinerMetapherausKubricksMeisterwerk»2001: Odyssee

im Weltraum«,auchschließen:

DerschwarzeMonolithstehtimFilmfürdieErkenntnisundEvolutionundtauchtimmerdortauf,wo

dieMenschheitsichverändertundweiterentwickelt.VielleichtistdernächsteMonolith,derdieÄrader

Sprachassistentenankündigt,bereitsaufdemWegzuuns.

Wirsolltenvorbereitetsein,umnichtmitgeschlossenenAugenanihmvorbeizulaufen.

94 95Literaturverzeichnis

Literaturverzeichnis

ANAND,Priya.TheRealityBehindVoiceShoppingHype.TheInformation.Zuletztgeprüft

am03.09.2018.www.theinformation.com|articles|the-reality-behind-voice-shopping-hype

BACHÉR,Frank,MelanieSCHLEGEL,MalteKOSUB undPascalFANTOU.

InterviewtvonHaraldFortmann.11.04.2018.Hamburg;DieneueMarketingweltvon

AlexaundCo

BAETZGEN,Andreas,Hrsg.BrandExperience.anjedemTouchpointaufdenPunkt

begeistern.1.Auflage2015.Stuttgart,2015

——— BrandExperience:EineEinführung.InBaetzgen,BrandExperience,S.3–15

BARRENBRÜGGE,Oliver.TheDivineVoice-DiegöttlicheStimme?-TeilEins.iCrossing.

Zuletztgeprüftam12.08.2018.www.icrossing.com|de|ideas|divine-voice-die-

goettliche-stimme-teil-eins

BARTH,Bertram.OrientierunginderUnübersichtlichkeit:DasSINUS-ModellfürJugend-

licheundjungeErwachseneinÖsterreich.InBarth;Flaig;Schäuble;Tautscher,Praxis

derSinus-Milieus®,S.81–94

BARTH,Bertram,CERNY,Sandra.IABTrendmonitor:DigitaleAssistenten.,Nr.5432

(2017)

BARTH,Bertram,FLAIG,BertholdB.HoherNutzwertundvielfältigeAnwendung:

EntstehungundEntfaltungdesInformationssystemsSinus-Milieus®.InBarth;Flaig;

Schäuble;Tautscher,PraxisderSinus-Milieus®,S.3–22

BARTH,Bertram,BertholdB. FLAIG,NorbertSCHÄUBLEund

ManfredTAUTSCHER,Hrsg.PraxisderSinus-Milieus®.GegenwartundZukunfteines

modernenGesellschafts-undZielgruppenmodells.Wiesbaden,2018

BENDEL,Oliver.300KeywordsInformationsethik.GrundwissenausComputer-,Netz-und

Neue-Medien-EthiksowieMaschinenethik.1.Aufl.2016.Wiesbaden:SpringerGabler,2016

doi:10.1007|978-3-658-10567-9.gbv.eblib.com|patron|FullRecord.aspx

BLOOP ENTERTAINMENT.WineFinder.Amazon.Zuletztgeprüftam05.08.2018.www.

amazon.com|Bloop-Entertainment-Wine-Finder|dp|B07CLH4WF3

BOPP,Christian.UserExperiencebeiVoiceUserInterfaces–EineTagebuchstudieamBei-

spielAmazonEcho.Facit.Zuletztgeprüftam20.08.2018.blog.facit-digital.com|user-

experience-bei-voice-user-interfaces-eine-tagebuchstudie-am-beispiel-amazon-echo

BRANDT,Mathias.Alexalerntschnell.Statista.Zuletztgeprüftam17.06.2018.de.statista.

com|infografik|10134|verfuegbare-skills-fuer-amazons-digitale-assistentin-alex

BUVAT,Jerome,TAYLOR,Mark,KeesJacobs,AmolKhadikarundAmritaSengupta.Conver-

sationalCommerce:WhyConsumersAreEmbracingVoiceAssistansinTheirLives,2018

COHEN,MichaelH.,GIANGOLA,JamesP.undBALOGH,Jennifer.Voiceuserinterface

design..2.Aufl.Boston,Mass.[u.a.]:Addison-Wesley,2004.

DIE BUNDESBEAUFTRAGTE FÜR DEN DATENSCHUTZ UND DIE

INFORMATIONSFREIHEIT.InternetauftrittderBundesbeauftragtenfürden

DatenschutzunddieInformationsfreiheit-Homepage-Sprachassistenten.Bund.Zuletzt

geprüftam10.09.2018.www.bfdi.bund.de|SharedDocs|Publikationen|DatenschutzKompakt-

Blaetter|Sprachassistenten.html?

EICHER,Hans.DieverblüffendeMachtderSprache.WasSiemitWortenauslösenoder

verhindernundwasIhrSprachverhaltenverrät.2.,durchgeseheneundkorrigierteAuf-

lage.Wiesbaden:Springer,2018.doi:10.1007|978-3-658-18663-0

96 97Literaturverzeichnis

EISENBRAND,Roland.AmazonverrätinsgeheimdiebeliebtestendeutschenAlexaSkills.

OnlineMarketingRockstars.Zuletztgeprüftam05.08.2018.omr.com|de|amazon-ale-

xa-top-10-skills

——— MarketingmitAmazonAlexaSkills:DassinddieerstenReichweitenzahlen.Online

MarketingRockstars.Zuletztgeprüftam17.06.2018.omr.com|de|amazon-alexa-skill-mar-

keting

ENGE,Eric.31MustKnowMobileVoiceUsageTrendsfor2018.StoneTempleConsulting.

Zuletztgeprüftam08.09.2018.www.stonetemple.com|voice-usage-trends|

STÖCKLE,Felix.ConnectingtheDots:DiekomplexenBeziehungenzwischenCustomer

Journeys,TouchpointsundBusinessEcosystemverstehen.InBaetzgen,BrandExperience,

S. 159–73

FLEIG,Jürgen.SWOT-Analyse:SowirdeineSWOT-Analyseerstellt.busines-wissen.de.

Zuletztgeprüftam01.07.2018.www.business-wissen.de|artikel|swot-analyse-so-wird-ei-

ne-swot-analyse-erstellt

GILLNER,Susanne.Googlepräsentiert»Speakable«:WebseitenfürdenAssistantopti-

mieren.InternetWordBusiness.Zuletztgeprüftam20.08.2018.www.internetworld.

de|online-marketing|google|google-praesentiert-speakable-webseiten-assistant-optimie-

ren-1568019.html

GLASCOTT,Mary.WhatisNaturalLanguageGeneration?narrarivescience.Zuletztge-

prüftam30.06.2018.narrativescience.com|Resources|Resource-Library|Article-Detail-

Page|what-is-natural-language-generation

GOEBEL,Tobias.Don‘tConfuseSpeechRecognitionwithNaturalLanguageUnderstan-

ding.aspect.Zuletztgeprüftam30.06.2018.blogs.aspect.com|dont-confuse-speech-recog-

nition-with-natural-language-understanding

GOOGLE.IntroductiontoStructuredData.Google.Zuletztgeprüftam20.08.2018.

developers.google.com|search|docs|guides|intro-structured-data

GUBERNATOR,Sebastian.Sprachassistenten:Senioren,freuteuchaufSiriundAlexa!

Welt.Zuletztgeprüftam23.07.2018.www.welt.de|debatte|kommentare|article172219708|-

Sprachassistenten-Senioren-freut-euch-auf-Siri-und-Alexa.html

HAASE,Daniel,KNOPF,IngoundRamezanian,Shajan.DieGeheimnisseunseresKörpers.

WDR.04.09.2018.Quarks&Co.Zuletztgeprüftam19.09.2018.www.wdr.de|mediathek|vi-

deo|sendungen|quarks-und-co|video-die-geheimnisse-unseres-koerpers-100.html

HARTMANN,Frank.InterviewtvonSebasitianKempkens.03.08.2013;Woherkommtdie

AngstvorTechnik?

HEUZEROTH,Thomas.KriegderSprachassistenten.Zuletztgeprüftam04.06.2018.

www.welt.de|print|die_welt|wirtschaft|article162439418|Krieg-der-Sprachassistenten.

html

HÖRMANN,Hans.PsychologiederSprache..Berlin,Heidelberg:SpringerBerlinHeidel-

berg,1967.doi:10.1007|978-3-662-25119-5

MUELLER,John.EnglishGoogleWebmasterCentraloffice-hourshangout.GoogleWeb-

masters.Zuletztgeprüftam19.08.2018.www.youtube.com|watch?v=JLCwGo43fAY.

KOLF,FlorianundHOFER,Joachim.Sprachassistent:AlexawirdzumSchreckenderHänd-

ler.Handelsblatt.Zuletztgeprüftam02.09.2018.www.handelsblatt.com|technik|

thespark|sprachassistent-alexa-wird-zum-schrecken-der-haendler|22812862.html

KREMPP,Matthias.ApplekündigtHomePodfürDeutschlandan.SpiegelOn-

line.Zuletztgeprüftam18.06.2018.www.spiegel.de|netzwelt|gadgets|apple-home-

pod-und-ios-11-4-smartspeaker-kommt-nach-deutschland-a-1210194.html

KUBRICK,Stanley.2001:OdysseeimWeltraum.2001:ASpaceOdyssey.UnterMitarbeitvon

KeirDullea.1968

KUHN,Thomas.JetztbringtAmazondiekünstlicheIntelligenzinsWohnzimmer.Wirt-

schaftswoche,Nr.44(2016):S.51–52.Zuletztgeprüftam08.06.2018.www.wiwo.de-

|technologie|digitale-welt|amazon-echo-jetzt-bringt-amazon-die-kuenstliche-intelli-

genz-ins-wohnzimmer|14712556.html

98 99Literaturverzeichnis

LALMAS,Mounia, O‘BRIEN,HeatherundYOM-TOV,Elad.Measuringuserengagement.

SanRafael,Calif,2014.site.ebrary.com|lib|alltitles|docDetail.action?docID=10990031

LEONG,Lewis.Whypersonalvoiceassistantsarethenextbigmarketingplatform.Zuletzt

geprüftam10.06.2018.blog.applovin.com|personal-voice-assistants-marketing-platform

LEVY,Nat.SiriShortcutsvs.AlexaSkills:HowAppleistappingappstocompetewith

Amazon’svoiceassistant.GeekWire.Zuletztgeprüftam07.09.2018.www.geekwire.

com|2018|siri-shortcuts-vs-alexa-skills-apple-tapping-apps-compete-amazons-voice-assistant

LIFERANDO.EssenbestellenmitAmazonAlexa–derLieferando.deSkill.Zuletzt

geprüftam05.08.2018.www.lieferando.de|blog|lieferando-skill-amazon-alexa

LINDNER,Alexandra.5Marketing-TippsfürSprachassistenten.com!professional.

Zuletztgeprüftam23.06.2018.www.com-magazin.de|news|business-it|5-marke-

ting-tipps-sprachassistenten-1466565.html

LATOSCHIK,MarcErich.SpezielleThemenderKI:NLP–NaturalLanguageProcessing–

Sprachverstehen,2006.Zuletztgeprüftam29.06.2018.www.techfak.uni-bielefeld.de|ags-

|wbski|lehre|digiSA|SS05|STDKI|Vorlesung|STdKI2NLP4.pdf

MILLER,George.ThemagicalnumberSeven,plusorminustwo:somelimitsonour

CapacityforProcessingInformation.PsychologicalReview,1955

NAGEL,TillS.CES:DigitaleSprachassistentensind2018eingrossesThema.

Zuletztgeprüftam13.06.2018.www.welt.de|wirtschaft|webwelt|article172455180|CES-

Digitale-Sprachassistenten-sind-2018-ein-grosses-Thema.html

NIEVA,Richard.GoogleHomeandeBaycantellyouhowmuchthat‘sworth.Cnet.

Zuletztgeprüftam20.09.2018.www.cnet.com|news|google-home-and-ebay-can-tell-you-

how-much-your-stuff-is-worth

PAKALSKI,Ingo.VoiceLabs:VorerstdochkeineWerbunginAlexa-Skills.Golem.de.

Zuletztgeprüftam03.09.2018.www.golem.de|news|voice-labs-vorerst-doch-keine-wer-

bung-in-alexa-skills-1706-128410.html

——— GoogleAssistant:ÜbersichtsseitefürverfügbareActionsgestartet.Golem.de.Zu-

letztgeprüftam24.06.2018.www.golem.de|news|google-assistant-uebersichtsseite-fu-

er-verfuegbare-actions-gestartet-1801-132062.html

——— StattGoogleAssistant:AlexaalsStandardassistentaufAndroid-Smartphonesnutz-

bar.t3nMagazin.Zuletztgeprüftam12.06.2018.t3n.de|news|android-smartphones-ale-

xa-statt-google-assistant-1077186

PAPERLEIN,Juliane.DieAudio-Revolution:Alexa&Co:WieSprachassistentenund

SmartspeakerdasRadiounddasMarketingverändern.Horizont,32/2018(2018):S.8–9

PEARL,Cathy.Designingvoiceuserinterfaces.Principlesofconversationalexperiences.

FirstEdition.Beijing:O‘Reilly,2017

PFLÜGER,Jörg.Ist»UserEngagement«messbar?enconda.Zuletztgeprüftam21.07.2018.

www.econda.de|2016|05|user-engagement

PROCTER & GAMBLE.Tide–StainRemover.Amazon.Zuletztgeprüftam06.08.2018.

www.amazon.com|P-G-Productions-Tide-Remover|dp|B01M9B7ZTB

SAS INSITUTE.WhatisNaturalLanguageProcessing?Zuletztgeprüftam29.06.2018.

www.sas.com|de_de|insights|analytics|what-is-natural-language-processing-nlp.html

SAUSSURE,Ferdinandd.GrundfragenderallgemeinenSprachwissenschaft.3.Aufl.Hrsg.

vonBally,Charles,Sechehaye,Albert.De-Gruyter-Studienbuch.Berlin,2001

SCHNEIDER,Ann-Christin.AlexamachtVoiceContentMarketingzumneuenTrend.

VoiceContentMarketing–AlexabistdudieZukunft?Xengoo.Zuletztgeprüftam

06.08.2018.www.xengoo.biz|2018|01|alexa-voice-content-marketing

SCHUSTER,Heidemarie.WasisteinSprachassistent?VogelCommunicationsGroupGmbH&

Co.KG.Zuletztgeprüftam13.06.2018.www.it-business.de|was-ist-ein-

sprachassistent-a-660785

100 101Literaturverzeichnis

SHAHANI,Aarti.VoiceRecognitionSoftwareFinallyBeatsHumansAtTyping,Study

Finds.npr.Zuletztgeprüftam01.07.2018.www.npr.org|sections|alltechconsidere-

d|2016|08|24|491156218|voice-recognition-software-finally-beats-humans-at-typing-

study-finds

SPLENDID RESEARCH GMBH.DigitaleSprachassistenten:EinerepräsentativeUm-

frageunter1.024DeutschenzumThemadigitaleSprachassistenten.Zuletztgeprüftam

11.09.2018.www.splendid-research.com.

STATISTA.AnteilderKaufkraftderDeutschennachAltersgruppen.Statista.

Zuletztgeprüftam27.09.2018.de.statista.com|statistik|daten|studie|163248|umfrage|kauf-

kraft-nach-altersgruppen

——— DurchschnittlicherBruttojahresverdienstderArbeitnehmerinDeutschlandnach

AltersgruppenimJahr2010.Zuletztgeprüftam30.09.2018.de.statista.com|statistik|daten

|studie|296286|umfrage|bruttojahresverdienst-der-arbeitnehmer-in-deutschland

——— AnteilderInternetnutzer,dieindenletztendreiMonatenEinkäufeundBestellun-

genüberdasInternetgetätigthaben,nachAltersgruppenimJahr2017.Statista.Zuletzt

geprüftam27.09.2018.de.statista.com|statistik|daten|studie|28542|umfrage|

nutzer-von-e-commerce-je-altersgruppe-im-jahr-2007

——— MitwelchenGerätenhabenSieschoneinmaleinenSprachassistentengenutzt?

Statista.Zuletztgeprüftam07.09.2018.de.statista.com|statistik|daten|studie|872294|

umfrage|nutzung-von-sprachassistenten-in-deutschland-nach-geraet

———SmartSpeaker.Statista.Zuletztgeprüftam07.09.2018.de.statista.com|statistik|studie|

id|55754|dokument|smart-speaker

StatistaundNorstat.WelcheGefahrensehenSiebeiderzunehmendenVerbreitungvon

Sprachassistenten?Statista.

——— WelchenNutzensehenSiebeiderzunehmendenVerbreitungvonSprachassistenten?

Statista.Zuletztgeprüftam22.07.2018

StiftungWarentest.HotlinesimTest:BeratenRoboterbesseralsMenschen?test,Nr.10

(2018).Zuletztgeprüftam27.09.2018.www.test.de|Hotlines-im-Test-5380471-0

STUBB‘S LEGENDARY BAR-B-Q.AskStubb.Amazon.Zuletztgeprüftam06.08.2018.

www.amazon.com|Stubbs-Legendary-Bar-B-Q-Ask-Stubb|dp|B072QCZBMF

TELLE,Brandon.BoardGamesAnswers.Amazon.Zuletztgeprüftam06.08.2018.

www.amazon.com|Brandon-Telle-Board-Games-Answers|dp|B01FNXM6SW

TRACTICA.AnzahlderNutzervirtuellerdigitalerAssistentenweltweitindenJahren

von2015bis2021.Statista

TRICARICO,Tanja.DatenschutzbeiSprachassistenten:LauschangriffimWohnzimmer.

DieTageszeitung.Zuletztgeprüftam10.09.2018.www.taz.de|!5532244

VIEREGGE,André.VielLärmumnichts:WasVoiceSearchwirklichfürSEAbedeutet.

Horizont.Zuletztgeprüftam12.08.2018.www.horizont.net|tech|kommentare|Viel-

Laerm-um-nichts-Was-Voice-Search-wirklich-fuer-SEA-bedeutet-145362

VoiceLabs.The2017VoiceReport.VoiceLabs.Zuletztgeprüftam23.09.2018.

s3-us-west-1.amazonaws.com|voicelabs|report|vl-voice-report-exec-summary_final.pdf

WASHINGTON POST PR.MorganStanleysponsorsTheWashingtonPost’s2016flash

briefingsonAlexa-enableddevices.WashingtonPost.Zuletztgeprüftam03.09.2018.

www.washingtonpost.com|pr|wp|2016|07|18|morgan-stanley-sponsors-the-washington-

posts-2016-flash-briefings-on-alexa-enabled-devices

WINARSKY,Norman.ThePresidentofSRIVenturesonBringingSiritoLife.Harvard

BusisnessReview2015,Nr.9.Zuletztgeprüftam17.06.2018.hbr.org|2015|09|the-

president-of-sri-ventures-on-bringing-siri-to-life

GÖPFERT,Yvonne.Sagwas!SprachsteuerungimMarketing.W&V,Nr.20(2018):S.19–22

ZAJECHOWSKI,Matthew.AutomaticSpeechRecognition(ASR)Software:An

Introduction.UsabilityGeek.Zuletztgeprüftam24.06.2018.usabilitygeek.com|

automatic-speech-recognition-asr-software-an-introduction

ANHANG

V

104 105Auswertung der Umfrage

Auswertung der Umfrage

Umfragedaten:

Im Zusammenhang dieser Bachelorarbeit wurde eine Umfrage in der Hamburger Werbe-

agentur Kolle Rebbe durchgeführt. Die gesamte Auswertung liegt im Folgenden vor.

Je nach dem, ob die Befragten einen Sprachassistenten nutzen oder nicht bzw. ob sie ihn

einem Kunden im Marketing empfehlen würden, wurden ihnen unterschiedliche Fragen

angezeigt. Welche Fragen, den Teilnehmergruppen angezeigt wurden, wird durch die

farbige Line am äußeren Rand jeder Seite dargestellt.

Personen, an die die Umfrage geschickt wurde: 294

Anzahl der Teilnehmer: 64

Umfragezeitraum: 31.07.18 - 15.08.18

Frag

en w

urde

n al

len

Teiln

ehm

ern

gest

ellt 1. InwelchemBereichvonKolleRebbearbeitestdu?

Kreation 42,2%

Beratung 35,9%

Sonstiges 21,9%

Sonstiges

Kreation

Beratung

Frag

en w

urde

n al

len

Teiln

ehm

ern

gest

ellt

3. Wiealtbistdu?

2. InwelchemBereichvonKolleRebbearbeitestdu?

20-25: 23,4%

26-30 23,4%

31-39 37,5%

40-49 10,9%

50+ 4,7%

Klassik 73,8%

Digital 26,2%

20-25

26-3031-39

40-4950+

Klassik

Digital

106 107Auswertung der Umfrage

4. Welche Rolle werden Sprachassistenten im zukünftigen Marketingspielen?

5. Hat,deinerMeinungnach,eineDienstleitungoderein ProduktmehrPotenzialSprachanwendungenzubenutzten?

DieBefragten konnten auf einer Skala von 0-100 eineMarkierung setzten,wobei 0 für

keine Rolle und 100 für eine großere Rolle stand. Das obere Diagramm zeigt die Normal-

verteilung der Aussagen. Das Mittel der Digitaler liegt bei 75,6. Das Mittel der Klassiker

liegt bei 59,64.

Dienstleitung 81,8%

Produkt 18,2%

Dienstleitung

Produkt

Frag

en w

urde

n al

len

Teiln

ehm

ern

gest

ellt

0 25 50 75 100

Klassik Digital

6. GibteseinProduktodereineDienstleistung,diedir spontaneinfällt,dieeingroßesPotenzialhätteSprach- anwendungenzubenutzten?

7. In welchem Bereich siehst du das meiste Potenzial von Sprachassistenten?(max.2auswählbar)

- Autos

- AlleBereiche,indenenmit

Menschen gesprochen wird

- TV-Gerät

- Erinnerungen

- Suche

- Finanzen

- Shopping

- Kundenservice

- Menschen mit Behinderung

- Übersetzer

- Reservierungen

- Altenpflege

- Notfallversorgung

0 5 10 15 20 25

Informationen vor dem Kauf

Informationen nach dem Kauf

Beratung vor dem Kauf

Beratung nach dem Kauf

Hören von Rezensionen

Erstellen von Rezensionen

direkter Verkauf

andere

Frag

en w

urde

n al

len

Teiln

ehm

ern

gest

ellt

108 109Auswertung der Umfrage

8. FälltdireineMarkeein,dieThird-Party-Appseinsetzt?

- Spotify

- Philips Hue

- Chefkoch

- Tagesschau

- Audi

- Domino‘s

- Techniker Krankenkasse

- Deutsche Bahn

- Burger King

- Bring

- FDP

- mytaxi

- Car2go

9. Welche2Sprachassistentenwerden,deinerMeinungnach,in Deutschland am meisten genutzt (max. 2 auswählbar)

0 10 20 30 40 50

Alexa

Siri

Google Assistent

Cortana

Bixby

Frag

en w

urde

n al

len

Teiln

ehm

ern

gest

ellt 10. Für welche Zielgruppe sollte Werbung über eine Sprachan-

wendungambestenkonzipiertwerden?(max.2auswählbar)

0 10 20 30 40 50 60

14-19

20-39

40-59

60+

11.WowerdenSprachassistenten,deinerMeinungnach,am häufigstengenutzt?

Unterwegs 27,8%

zu Hause 72,2%

Unterwegs

zu Hause

Frag

en w

urde

n al

len

Teiln

ehm

ern

gest

ellt

110 111Auswertung der Umfrage

12. Bei welchem Kunden von Kolle Rebbe siehst du Potenzial einenSprachassistentenimMarketingzubenutzten? (Mehrfachauswahlmöglich)

Frag

en w

urde

n al

len

Teiln

ehm

ern

gest

ellt

0 10 20 30 40

O2

Netflix

Audi

Audible

Lufthansa

DAZN

Hey car

BA für Arbeit

inlingua

Enterprise

Aktion Mensch

TUI

arte

Peta

VGH Versicherung

LVM Versicherung

Hypovereinsbank

Hansgrohe

Ritter Sport

Kaldewei

Alpina

Krombacher

Leibniz

Rauch

13.AufwelchemGerätwerdenSprachassistenten,deiner Meinungnach,amhäufigstenbenutzt?

14. Kommentare und Anmerkungen zu Sprachassistenten im Marketing allgemein

integriert im Auto 18,2%

auf dem Handy 36,4%

Voice-Only-Geräten 45,5%

- Sprachassistenten wird im Marketing zu viel Potenzial zugesprochen

- keinNutzerwirdesschätzen,wennermitSchleichwerbungbelästigtwird

- jederRentnerkannmitdenAssistentensprechenkönnen

- WerbungüberSprachassistentenistabsolutüberflüssigundbelästigtdenNutzer

- ichbenutzekeinenSprachassistenten,weilichSorgehabebelauschtzuwerden

- MarketingmitdigitalenAssistentensolltenurbetriebenwerden,wennesSinn

macht und nicht auf-Teufel-komm-raus

- Sprachassistenten werden in Zukunft immer wichtiger

Frag

en w

urde

n al

len

Teiln

ehm

ern

gest

ellt

auf dem Handy

Voice-Only-Geräte

integriert im Auto

112 113Auswertung der Umfrage

15.NutztdubereitseinenSprachassistenten?

16.WarumnutztdueinenSprachassistenten? (Mehrfachauswahlmöglich)

FragenwurdenausschließlichdenNutzerngestellt

Nutzung

nein

39%

ja 61%keine Empfehlung

keine Empfehlung

Emfe

hlun

g

Emfe

hlun

g

Würdest du einem passenden Kunden das Medium Voice im Marketingempfehlen?

DienachfolgendenFragenwurdenausschließlichdenNutzernvonSprachassistentenangezeigt.

Frag

en w

urde

n al

len

Teiln

ehm

ern

gest

ellt

0 5 10 15 20 25

bequemer

schneller

Multitasking ist möglich

natürlicher zu bedienenen alsComputer oder Handy

intuitiver zu bedienen

Andere

17. Bitte nenne ein Beispiel wofür du es benutzt (Mehrfachauswahlmöglich)

0 5 10 15 20

Informationen suchen

Musik steuern

Wettervorhersage

an Termine erinnern

Nachrichten hören

Witze etc.

Taxi bestellen

Waren bestellen

Emails vorlesen lassen

Essen bestellen

Andere

Andere:

- Wecker&Timer

- Navigation

- Smartphone steuern

- Anrufe

- Texte diktieren

- Hörbüchersteuern

FragenwurdenausschließlichdenNutzerngestellt

114 115Auswertung der Umfrage

18. Was sollte an der Funktion des Assistenten verbessert werden,damiterdirnochbessergefällt?

- SchönereStimme

- GrößererWortschatz

- mehr Smarthome-Geräte

- eingeschlossenesSystem,sodasskeineDatenfürWerbunganDritte

gelangen kann

- intelligenter

- Akzente verstehen

- Signalworte wie »Alexa« schränken die Nutzung ein

- Sicherer und anonymer gestalten

- erweiterte Befehle

- bessere Verknüpfung zu anderen Geräten

- komplexere Sätze verstehen

- Routinen der Nutzer erkennen

- schnellere Reaktionszeit

- bessere Verknüpfung zu Nicht-Amazon-Programme

- Vertrauen in der Sicherheit sollte ausgebaut werden

FragenwurdenausschließlichdenNutzerngestellt 19.WieoftnutztduThird-Party-AppsvonSprachassistenten?

nie 65%

monatlich 6%

alle 2 Wochen 3%

alle 2 Tage 21%

täglich 6%

20.Wären,deinerMeinungnach,dieHauptargumentedas Medium Voice einen Kunden zu empfehlen (max. 2 auswählbar)

FragenwurdenausschließlichdenNutzerngestellt

0 5 10 15 20

Schnelligkeit

Innovation

natürliche Kommunikation

besserer Kundenservice

Emotionen können besserrübergebracht werden

nah an der Zielgruppe

Andere

nie

alle 2 Tage

monatlich

täglich alle 2 Wochen

116 117Auswertung der Umfrage

21.WarumwürdestduesdemKundennichtempfehlen,ob wohlduesselbernutzt?

Andere:

- noch nicht weitgenug entwickelt

- Sensibilisierung der Menschen braucht noch Zeit

- es gibt keine Verbindung zur Agentur

- Abneigung der Nutzen gegen Werbung in Sprachassistenten

0 1 2 3 4

Sprachassistent wird zu selten genutzt

Sprachanwendungen werden nichtgenutzt

zu unpraktisch

zu wenig Marketingstudien

mich hat der Assistent nicht überzeugt

Das Medium hat kein Potenzial

keine Möglichkeit Werbungzu betreiben

Andere

FragenwurdenausschließlichdenNutzerngestellt

DienachfolgendenFragenwurdenausschließlichdenNichtnutzernvonSprachassistentenangezeigt.

22.WarumnutztdukeinenSprachassistenten?Wasstörtdich anihm?(Mehrfachauswahlmöglich)

0 2 4 6 8 10 12

ich sehe keinen Mehrwert darin

zu umständlich

ich fühle mich beobachtet

Spracherkennung zu ungenau

unangenehm mit Computer zusprechen

dauert zu lange

zu unpersönlich

Andere

FragenwurdenausschließlichdenNichtnutzerngestellt

118 Auswertung der Umfrage

23. Was würde dich bewegen doch einen Sprachassistenten zu nutzen

24.WarumwürdestdueseinemKundennichtempfehlen? (Mehrfachauswahlmöglich)

- merkliche Verbesserung gegenüber manueller Bedienung

- eigenes Heimnetzwerk ohne Verbindung zum Internet

- irgendwelchewirklichneueMöglichkeiten(Musiksteuerngehtauchschnell

mit dem Handy)

- wenn es bequemer und schneller geht

- günstiger,sicherer,genauer

- Sicherheit

FragenwurdenausschließlichdenNichtnutzerngestellt

0 1 2 3 4 5 6

Datenschutz

Kunden sind nicht aufgeschlossen

Zielgruppe zu klein

zu umständlich

keine Werbemöglichkeiten

Medium wird sich nicht durchsetzten

zu teuer in der Entwicklung

zu unpersönlich

120 Eidesstattliche Erklärung

Eidesstattliche Erklärung

Ich erkläre hiermit des Eides statt, dass ich die vorliegendeArbeit selbstständig verfasst und dabei

keineanderenalsdieangegebenenHilfsmittelbenutzthabe.SämtlicheStellenderArbeit,dieimWort-

lautoderdemSinnnachPublikationenoderVorträgenandererAutorenentnommensind,habeichals

solche kenntlich gemacht. Die Arbeit wurde bisher weder gesamt noch in Teilen einer anderen Prüfungs-

behördevorgelegtundauchnochnichtveröffentlicht.