BIG DATA im E-Commerce - Potenziale und Herausforderungen des Web Mining am Bsp. eines...

43
BIG DATA der Daten-Tsunami Potenziale und Herausforderungen des Web Mining am Bsp. eines Online-Shopping-Portals Lynx Akademie Dr. Christian Holsing, August 2013

description

BIG DATA im E-Commerce - Potenziale und Herausforderungen des Web Mining am Bsp. eines Online-Shopping-Portals INHALT 1.Entstehung, Relevanz und Definition 2.Anwendungsszenarien 3.Kritik 4.KDD-Prozess und Data Mining 5.Anwendung: Web Mining im E-Commerce

Transcript of BIG DATA im E-Commerce - Potenziale und Herausforderungen des Web Mining am Bsp. eines...

Page 1: BIG DATA im E-Commerce - Potenziale und Herausforderungen des Web Mining am Bsp. eines Online-Shopping-Portals

BIG DATA

– der Daten-Tsunami

Potenziale und Herausforderungen des Web

Mining am Bsp. eines Online-Shopping-Portals

Lynx Akademie

Dr. Christian Holsing, August 2013

Page 2: BIG DATA im E-Commerce - Potenziale und Herausforderungen des Web Mining am Bsp. eines Online-Shopping-Portals

Agenda

2

1. Entstehung, Relevanz und Definition

2. Anwendungsszenarien

3. Kritik

4. KDD-Prozess und Data Mining

5. Anwendung: Web Mining im E-Commerce

Page 3: BIG DATA im E-Commerce - Potenziale und Herausforderungen des Web Mining am Bsp. eines Online-Shopping-Portals

3

Portfolio E-Commerce@Lynx

CONSULTING TECHNOLOGY MARKETING

Strategie-/ Managementberatung:

Online-Geschäftsmodelle

Multichannel-Retailing

Social Commerce

Konzeption und Design Online-Shop

und Features

Research + Consumer Insights

(Erhebung von Primär- und

Sekundärdaten)

Projektmanagement

Interim Management

Partnermanagement (Full Service)

SMART UP:

Coaching von Start-ups

Business Development

Gründercoaching KfW

SAP E-Commerce und Web Channel

Experience Management

Open Source Shop-Systeme:

• Apache OFBiz/

Lynx eCommerce Suite

• Magento

Content-Management-Systeme

Product Information Management

(PIM)

Portallösungen

Integration ERP

Online-Marketing

Strategie

Implementierung (SEM,

SEO, Display, Affiliate,

Social Media, etc.)

Shop-Check (Technik, Usability,

CRO)

Web Intelligence:

Web Analytics (Software,

Testing und Reporting)

CRM E-Commerce (CRM,

Data Mining, Predictive

Analytics)

Ganzheitliche Beratung aus einer Hand!

www.lynx-ecommerce.de

Page 4: BIG DATA im E-Commerce - Potenziale und Herausforderungen des Web Mining am Bsp. eines Online-Shopping-Portals

4

Exzellent vernetzt!

Mitgliedschaften und Kooperationen

K5 Liga

Die K5 Liga ist von Exciting Commerce initiiert und vereint

Anbieter von Dienstleistungen und Agenturen, die den

Online-Handel in strategischen Wachstumsphasen unterstützen.

ECC-Club

Der ECC-Club ist vom E-Commerce-Center Köln (ECC) mit dem

Ziel initiiert, den Wissenstransfer zwischen betrieblicher Praxis

und Wissenschaft zu fördern und von den gewonnenen

Erkenntnissen zu profitieren.

Deutscher Marketing-Verband

Vertretung von mehr als 14.000 Führungskräften und

marketing-orientierten Unternehmen.

Lehrstuhl für BWL, insb. Marketing, Universität Hagen

Gemeinsames Forschungsprojekt ‚Affiliate Marketing‘

Page 5: BIG DATA im E-Commerce - Potenziale und Herausforderungen des Web Mining am Bsp. eines Online-Shopping-Portals

5

DER

ONLINE-TSUNAMI ENTSTEHUNG, RELEVANZ

UND DEFINITION

Page 6: BIG DATA im E-Commerce - Potenziale und Herausforderungen des Web Mining am Bsp. eines Online-Shopping-Portals

BIG DATA: in aller Munde

6

2011: McKinsey-Studie

2011: Gartner-Hype-Cycle (2 Jahre Mainstream Adoption)

2013: Berichte und Titel

Süddeutsche Zeitung

Die Zeit

FAZ

Spiegel (13. Mai)

Page 7: BIG DATA im E-Commerce - Potenziale und Herausforderungen des Web Mining am Bsp. eines Online-Shopping-Portals

Zusätzlich zu Transaktionsdaten fallen nun an:

7

Quelle: Bitkom 2012, S. 11

Page 8: BIG DATA im E-Commerce - Potenziale und Herausforderungen des Web Mining am Bsp. eines Online-Shopping-Portals

Weltweite Menge an Daten wächst rasant

8

Prognose von IDC:

2012: 2,8 Zettabyte Datenvolumen

2020: 40 Zettabyte Datenvolumen

Quellen: Bitkom 2012, S. 12 (Abb.); IDC 2012

Page 9: BIG DATA im E-Commerce - Potenziale und Herausforderungen des Web Mining am Bsp. eines Online-Shopping-Portals

BIG DATA: Definition

9

Quelle: Bitkom 2012

Der Begriff Big Data wurde geprägt, um

die wirtschaftlich sinnvolle Gewinnung und Nutzung entscheidungsrelevanter Erkenntnisse

aus qualitativ vielfältigen, unterschiedlich strukturierten Informationen zu bezeichnen,

die zudem einem schnellen Wandel unterliegen und in bisher ungekanntem Umfang anfallen.

Big Data umfasst Konzepte, Methoden, Technologien, IT-Architekturen sowie Tools, mit denen sich die Informationsflut in Bahnen lenken lässt.

Page 10: BIG DATA im E-Commerce - Potenziale und Herausforderungen des Web Mining am Bsp. eines Online-Shopping-Portals

10

DER

ONLINE-TSUNAMI ANWENDUNGS-

SZENARIEN

Page 11: BIG DATA im E-Commerce - Potenziale und Herausforderungen des Web Mining am Bsp. eines Online-Shopping-Portals

BIG DATA: Herausforderungen (3 V‘s)

11

Volume

Variety Velocity

BIG DATA

Quelle: Bitkom 2012

Page 12: BIG DATA im E-Commerce - Potenziale und Herausforderungen des Web Mining am Bsp. eines Online-Shopping-Portals

Der Markt für IT und Beratung wächst mit!

12

Umsatz mit Big Data-Anwendungen steigt (Bitkom 2012)

2012: 4,6 Mrd. Euro

2016: 16,0 Mrd. Euro

4,4 Mio. neue Jobs im IT-Bereich durch Big Data

(Gartner 2012)

Page 13: BIG DATA im E-Commerce - Potenziale und Herausforderungen des Web Mining am Bsp. eines Online-Shopping-Portals

BIG DATA: Anwendungen

13

Kreditkarten-Missbrauch vorhersagen

Algorithmen zum Verkehrsmanagement

Bonitätsprüfung

Individuelle Medizin

Supermarkt: Kundenkarten, Absatzprognosen, Warenkorbanalysen

Online-Geschäftsmodelle: oft Big Data in Reinkultur

Sammeln, Analysieren und Vermarkten von Informationen zielgenaue Werbung

Google

facebook

Page 14: BIG DATA im E-Commerce - Potenziale und Herausforderungen des Web Mining am Bsp. eines Online-Shopping-Portals

Hände hoch!

14

Nutzer einer Kundenkarte?

Meilen-Sammler?

Klick auf Online-Banner?

Profil in Sozialen Medien?

Mindestens einmal mit Ja geantwortet?

Glückwunsch, auch DU bist BIG DATA-Lieferant!

Immer mit Nein geantwortet?

Trotzdem Glückwunsch!

Page 15: BIG DATA im E-Commerce - Potenziale und Herausforderungen des Web Mining am Bsp. eines Online-Shopping-Portals

15

DER

ONLINE-TSUNAMI KRITIK

Page 16: BIG DATA im E-Commerce - Potenziale und Herausforderungen des Web Mining am Bsp. eines Online-Shopping-Portals

Kritik

16

Datenerhebung und -auswertung erfolgt oft nach technischen Aspekten

Kritik der Sozialforscherin Danah Boyd: Größere Datenmengen sind nicht qualitativ besser (rep.

Stichprobe) "Was" und "Warum" seien zwei unterschiedliche Fragen Bei Interpretationen sei Vorsicht geboten Nur weil es verfügbar ist, sei es nicht ethisch

Bedeutet Big Data das Ende aller Theorie?

Chris Anderson, Chefredakteur WIRED: Glaubwürdigkeitsproblem jeder wissenschaftlichen Hypothese und jedes Modells bei gleichzeitiger Echtzeitanalyse von Systemen. Korrelationen werden wichtiger als kausale Erklärungsansätze.

Page 17: BIG DATA im E-Commerce - Potenziale und Herausforderungen des Web Mining am Bsp. eines Online-Shopping-Portals

17

DER

ONLINE-TSUNAMI KDD UND

DATA MINING

Page 18: BIG DATA im E-Commerce - Potenziale und Herausforderungen des Web Mining am Bsp. eines Online-Shopping-Portals

Knowledge Discovery in Databases-Prozess

18

SelektionVor-

verarbeitung

Trans-

formationData Mining

Interpretation/

Evaluation

Daten Wissen

Definition FAYYAD/PIATETSKY-SHAPIRO/SMYTH 1996, p. 39:

„Knowledge discovery in databases is the non-trivial process

of identifying valid, novel, potentially useful, and ultimately

understandable patterns in data.“

Quelle: Eigene Abb. in Anl. an FAYYAD/PIATETSKY-SHAPIRO/SMYTH 1996, p. 39

Page 19: BIG DATA im E-Commerce - Potenziale und Herausforderungen des Web Mining am Bsp. eines Online-Shopping-Portals

Data Mining

19

Data Mining = Datenmustererkennung Definition FAYYAD/PIATETSKY-SHAPIRO/SMYTH 1996, p. 39: „Data Mining ist die Anwendung spezifischer Algorithmen zur Extraktion von Mustern aus Daten.“

Daten werden als neues ‚Öl‘ oder ‚Gold‘ bezeichnet

Parallele zum Goldrausch im 19. Jh.:

Diejenigen, die Ausrüstung, Werkzeug und Expertise verkaufen, machen sehr gute Geschäfte

Google: In Stanford entwickelter Algorithmus von BRIN AND PAGE 1998: The Anatomy of a Large-Scale Hypertextual Web Search Engine

Page 20: BIG DATA im E-Commerce - Potenziale und Herausforderungen des Web Mining am Bsp. eines Online-Shopping-Portals

Web Mining

20

Web Mining

Web Content Mining

Web StructureMining

Web UsageMining

Web Content Mining: Extraktion von Wissen (oft auch Text Mining)

Web Structure Mining: Analyse von Seitenstrukturen (Google PageRank)

Web Usage Mining: „data mining activities with the goal to analyse and

predict the behaviour of websites’ users“(GROSSMANN/HUDEC/KURZAWA)

Quelle: eigene Abb. in Anl. an ZAÏANE 1999

Page 21: BIG DATA im E-Commerce - Potenziale und Herausforderungen des Web Mining am Bsp. eines Online-Shopping-Portals

Informationsgewinnung im Internet

21

Logfiles:

indirekte Beobachtung

die beobachtete Person ist sich der Beobachtung nicht bewusst ( kein Beobachtungseffekt)

Methoden der Informationsgewinnung

im Internet

Primärforschung

Online-Befragung

Online-Beobachtung

Online-Experiment

Online-Panel

Sekundärforschung

Online-Datenbanken

Quelle: Eigene Abb. in Anl. an FRITZ 2004

Page 22: BIG DATA im E-Commerce - Potenziale und Herausforderungen des Web Mining am Bsp. eines Online-Shopping-Portals

Entscheidungsbaum im Web Usage Mining

Bsp.: Kauf im Online-Shop 22

NeinJa

< 3 Minuten> 3 Minuten

NeinJa

Knoten 0

3% Kauf

97% Nicht-Kauf

Knoten 1

6% Kauf

94% Nicht-Kauf

Knoten 3

9% Kauf

91% Nicht-Kauf

Knoten 5

11% Kauf

89% Nicht-Kauf

Knoten 6

8% Kauf

92% Nicht-Kauf

Knoten 4

5% Kauf

95% Nicht-Kauf

Knoten 2

2% Kauf

98% Nicht-Kauf

Sonderangebote

Verweildauer

Wochentag

Ziel: Datenobjekte

aufgrund der Ausprägungen

von unabhängigen

Variablen sukzessive in

möglichst homogene

Teilmengen mit jeweils

ähnlichen Werten der

Zielgröße aufteilen

Generierung

Klassifikationsregeln

Wurzel-

knoten

Quelle: HOLSING 2012

Page 23: BIG DATA im E-Commerce - Potenziale und Herausforderungen des Web Mining am Bsp. eines Online-Shopping-Portals

23

DER

ONLINE-TSUNAMI ANWENDUNG

WEB MINING

Page 24: BIG DATA im E-Commerce - Potenziale und Herausforderungen des Web Mining am Bsp. eines Online-Shopping-Portals

Leitfrage der exemplarischen Untersuchung

Welche Faktoren, insbesondere welche Social-

Shopping-Funktionen, beeinflussen vorökono-

mische und ökonomische Zielgrößen in Social-

Shopping-Communities?

24

Stimuli Reaktion

(unabhängige Variablen) (abhängige Variable)

FunktionenCharakteristika

des Käufers

Kaufentscheidungs-

prozess

Untersuchte Zielgrößen

des Kaufverhaltens

z. B.: kulturelle Problemerkennung Click-Out (Konversion)

Startseite soziale Informationssuche Verweildauer

Suchfilter persönliche Informationsbewertung

Ratings psychologische Entscheidung

Social Shopping-Funktionen Nachkaufverhalten

beobachtbar beobachtbar

Black Box (Organismus) des Käufers

nicht beobachtbar

Quelle: Holsing 2012

Page 25: BIG DATA im E-Commerce - Potenziale und Herausforderungen des Web Mining am Bsp. eines Online-Shopping-Portals

Untersuchungsobjekt

25

Logfiles einer führenden Social Shopping

Community im deutschsprachigen Raum

Kategorien: Mode, Möbel und Lifestyle

Zielgruppe: Frauen

Ca. 1,5 Mio. Produkte gelistet

Ca. 600 teilnehmende Online-Shops

Page 26: BIG DATA im E-Commerce - Potenziale und Herausforderungen des Web Mining am Bsp. eines Online-Shopping-Portals

S-O-R-Modell des Kaufverhaltens

(KOTLER/ARMSTRONG/WONG/SAUNDERS 2011) 26

Reaktion

Marketingstimuli Umfeldstimuli PersonKaufentscheidungs-

prozessKaufentscheidungen

Produkt konjunkturelle kulturelle Problemerkennung Wahl eines Produkts

Preis technologische soziale Informationssuche Wahl einer Marke

Distribution politische persönliche Informationsbewertung Wahl eines Händlers

Kommunikation kulturelle psychologische Entscheidung Kaufzeitpunkt

Nachkaufverhalten Kaufmenge

beobachtbar

Exogene Stimuli Black Box (Organismus) des Käufers

beobachtbar nicht beobachtbar

Page 27: BIG DATA im E-Commerce - Potenziale und Herausforderungen des Web Mining am Bsp. eines Online-Shopping-Portals

Logfile-Analyse: Daten und Prozess

27

Tägliche Datenübermittlung an Server

Zeitraum: 6 Monate

Tracking für jeden Besuch: aufgerufene Seiten,

Dauer, etc.

Limitationen:

Keine Wiederholungsbesuche

Kein Tracking in partizipierenden Online-Shops

2009-05-21 00:43:59,689|CLICK_OUT|0A7916144EAF0AC292515EB34A0D

9F0C|Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; .NET CLR 1.1.4322; .NET CLR 2.0.50727; .NET CLR 3.0.04506.30; InfoPath.1)|77.188.xx.xx|NOBOT|zX+itsFeZEG2ss4f|NOT-LOGGED-IN|||/search.searchresultcontainer.clickoutbutton.clickoutform/2331697/4681401|2331697|Mode/Bekleidung/Kleider

Page 28: BIG DATA im E-Commerce - Potenziale und Herausforderungen des Web Mining am Bsp. eines Online-Shopping-Portals

Logfile-Analyse: Orientierung am KDD-Prozess

28

Software: SAS Enterprise Miner 6.2

Pre-processing:

Sessions: 7,8 Mio. 2,9 Mio.

Ziel: Charakterisierung Sessions

4 Variablenkategorien Daten-

aufbereitung

Logfiles

Mustererkennung:

-Deskriptiv

-Segmentierung

(Prognose-)

Modellierung

Beurteilung und

Interpretation

Page 29: BIG DATA im E-Commerce - Potenziale und Herausforderungen des Web Mining am Bsp. eines Online-Shopping-Portals

Deskriptive Statistiken

29

Variablenkategorie Variable Mittelwert SD Minimum Maximum Median

Generell

LOG_IN 0,01 0,11 0,00 1,00 0,00

KAMPAGNE 0,68 0,47 0,00 1,00 1,00

WOCHENENDE 0,29 0,45 0,00 1,00 0,00

DAUER 201,13 324,09 2,00 2.699,00 72,00

DAUER_KLICK 34,16 58,34 1,00 1.302,00 17,00

PRODUKT 0,91 2,03 0,00 664,00 0,00

PRODUKT_DAUER 17,28 60,18 0,00 2.261,00 0,00

START 0,09 0,45 0,00 130,00 0,00

Suchfunktionen

SUCHFELD 1,15 2,55 0,00 520,00 0,00

SUCHE_GESCHLECHT 0,73 4,02 0,00 430,00 0,00

SUCHE_KATEGORIE 1,48 6,67 0,00 557,00 0,00

SUCHE_MARKE 0,31 2,49 0,00 369,00 0,00

SUCHE_PREIS 0,12 1,69 0,00 220,00 0,00

SUCHE_SALES 0,05 0,96 0,00 234,00 0,00

SUCHE_SHOP 0,12 0,91 0,00 178,00 0,00

Social Shopping

RATING_PROD 13,81 32,36 0,00 100,00 0,00

RATING_SHOP 13,66 32,26 0,00 100,00 0,00

LISTE 0,02 0,23 0,00 112,00 0,00

STYLE 0,01 0,16 0,00 95,00 0,00

TAG 0,03 0,57 0,00 183,00 0,00

PROFIL 0,01 0,23 0,00 121,00 0,00

Transaktion CLICK_OUT 0,41 0,49 0,00 1,00 0,00

Page 30: BIG DATA im E-Commerce - Potenziale und Herausforderungen des Web Mining am Bsp. eines Online-Shopping-Portals

Logfile-Analyse: Deskriptive Statistiken

30

Großteil der Besuche: Wochentag (71,12%)

Sonntags (16,45%) und montags (16,13%) am höchsten

Verlauf: Sinken der Besucherzahlen von So. bis Sa.

Page 31: BIG DATA im E-Commerce - Potenziale und Herausforderungen des Web Mining am Bsp. eines Online-Shopping-Portals

Logfile-Analyse: Deskriptive Statistiken II

31

Variable HOUR

Anstieg von morgens bis zur

Spitze um ca. 21:00 Uhr

Besuche steigen im

Tagesverlauf von morgens bis

zur Spitze am Abend an, wobei

zwischen 21:00 Uhr und 22:00

Uhr die meisten Besuche

stattfinden (8,42 Prozent)

Mithilfe dieser Auswertungen

könnte z. B. ein Zeitpunkt

festgelegt werden, an dem

bestimmte Neuigkeiten online

gestellt werden, z. B. zur

Hauptnutzungszeit

Page 32: BIG DATA im E-Commerce - Potenziale und Herausforderungen des Web Mining am Bsp. eines Online-Shopping-Portals

Logfile-Analyse: Angewandte Methoden

32

Angewandte Methoden:

Logistische Regression

Entscheidungsbaum

Multi Layer Perceptron (Form eines Künstlichen

Neuronalen Netzes)

Fokus auf logistischer Regression, da hiermit eine

Bestimmung der Wirkungsrichtung der Einfluss-

größen durch die Koeffizienten möglich ist

Page 33: BIG DATA im E-Commerce - Potenziale und Herausforderungen des Web Mining am Bsp. eines Online-Shopping-Portals

Logistische Regression

33

Annahme einer Variablen Z als Linearkombination

der Prädiktoren Xi (aggregierte Einflussgröße):

n

j

jj xz1

0 *

Page 34: BIG DATA im E-Commerce - Potenziale und Herausforderungen des Web Mining am Bsp. eines Online-Shopping-Portals

Logfile-Analyse: Aufbereitete Variablen und

Hypothesen (Zielgröße Click-Out) 34

Variablenkategorie Variable Ausprägungen/

Wertebereich Beschreibung Hypothese

Erwartetes

Vorzeichen

Generell

LOG_IN 0: nein, 1: ja Log-In eines Nutzers Kontrollvar. –

WOCHENENDE 0: nein, 1: ja Unterscheidung Wochentag/Wochenende Kontrollvar. –

DAUER_KLICK 1, 00–2.699,99 Durchschnittl. Verweildauer in Sek. je Seitenaufruf H1 +

PRODUKT 0, 1, 2, … Aufruf einer Produktdetailseite H2 –

START 0, 1, 2, … Aufruf der Startseite (Homepage/Index) H3 –

Suchfunktionen

SUCHFELD 0, 1, 2, … Nutzung Suchfeld H4a –

SUCHE_GESCHLECHT 0, 1, 2, … Nutzung Filter Geschlecht H4b –

SUCHE_KATEGORIE 0, 1, 2, … Nutzung Filter Kategorie H4c –

SUCHE_MARKE 0, 1, 2, … Nutzung Filter Marke H4d –

SUCHE_PREIS 0, 1, 2, … Nutzung Filter Preis H4e –

SUCHE_SALES 0, 1, 2, … Nutzung Filter Sales H4f –

SUCHE_SHOP 0, 1, 2, … Nutzung Filter Shop H4g –

Social Shopping

RATING_PROD 0,00–1,00 Anteil Produktdetailseiten, bei denen ein Produkt-

Rating größer/gleich 3 Sterne (60 %) vorhanden ist H5a +

RATING_SHOP 0,00–1,00 Anteil Produktdetailseiten, bei denen ein Shop-Rating

größer/gleich 3 Sterne (60 %) vorhanden ist H5b +

LISTE 0, 1, 2, … Aufruf einer Liste H6a –

STYLE 0, 1, 2, … Aufruf eines Styles H6b –

TAG 0, 1, 2, … Nutzung eines Tags (nutzergeneriert) H7 +

PROFIL 0, 1, 2, … Aufruf einer Profilseite H8 –

Transaktion CLICK_OUT 0: nein, 1: ja Weiterleitung zu einem partizipierenden Online-Shop Zielgröße

Quelle: Holsing 2012

Page 35: BIG DATA im E-Commerce - Potenziale und Herausforderungen des Web Mining am Bsp. eines Online-Shopping-Portals

Logistische Regressionsanalyse:

Zielgröße Click-Out (0/1) 35

Variable B Standard-

fehler

Wald Chi-

Square Exp(B)

95 % Intervall

Untergrenze

95 % Intervall

Obergrenze

Hyp.

bewährt?

Konstante 3,675 0,023 25.215,121*

Generell

LOG_IN (=0) –4,996 0,023 46.938,893* 0,007 0,006 0,007 j

WOCHENENDE (=0) –0,028 0,003 99,669* 0,972 0,967 0,978 j

DAUER_KLICK 0,297 0,001 42.665,871* 1,346 1,343 1,350 j

PRODUKT 0,086 0,003 693,366* 1,090 1,083 1,097 n

START –1,840 0,011 29.026,595* 0,159 0,156 0,162 j

Such-

funktionen

SUCHFELD –0,387 0,002 30.750,964* 0,679 0,676 0,682 j

SUCHE_GESCHLECHT 0,172 0,003 4.751,073* 1,188 1,182 1,194 n

SUCHE_KATEGORIE –0,012 0,002 42,034* 0,988 0,985 0,992 j

SUCHE_MARKE 0,111 0,004 920,943* 1,117 1,109 1,125 n

SUCHE_PREIS 0,310 0,006 2.687,315* 1,363 1,348 1,380 n

SUCHE_SALES 0,212 0,008 675,678* 1,236 1,217 1,256 n

SUCHE_SHOP –0,107 0,006 365,097* 0,899 0,889 0,909 j

Social

Shopping

RATING_PRODUKT 0,003 0,001 10,624** 1,003 1,001 1,005 j

RATING_SHOP 0,213 0,001 48.530,326* 1,238 1,236 1,240 j

LISTE –1,862 0,044 1.780,645* 0,155 0,142 0,169 j

STYLE –0,652 0,021 970,791* 0,521 0,500 0,543 j

TAG –0,222 0,011 394,887* 0,801 0,783 0,819 n

PROFIL –2,584 0,040 4.145,029* 0,075 0,070 0,082 j

Anm.: * p < 0,0001; ** p < 0,001; Likelihood Ratio-Test: χ2(18) = 264.030,374; p < 0,0001; Pseudo-R2 = 0,07; Klassifikationsgüte = 63,4%

Quelle: Holsing 2012

Page 36: BIG DATA im E-Commerce - Potenziale und Herausforderungen des Web Mining am Bsp. eines Online-Shopping-Portals

Überblick: Zielgrößen Click-Out und Verweildauer

36

Startseite

Click-Out

Log-In

Besuch Wochenende

Suchfunktionen:

Geschlecht, Marke,

Preis und Sales

Rating

(Produkt und Shop)

Social-Shopping-

Funktionen: Liste,

Profil, Style und Tag

Suchfunktionen:

Suchfeld, Kategorie

und Shop

Verweildauer/Seite +

+

+

+

+

+

*: bis auf Log-In sind Koeffizienten

signifikant positiv. Verweildauer/

Seite und Rating nicht untersucht.

Stimuli

(unabh. Var.)

Reaktion

(abh. Var.)

Verweildauer

gesamt

+

+ *

Produktdetailseite

Results also conform

to the following

descriptive results

Avg. visit duration of

logged-in users: 125

sec.; non-logged-in

users: 202 sec.

Visit duration in

sessions, in which at

least one list or style

is considered, is

56% higher

The number of clicks

in such sessions is

substantially higher;

on average 3.7

clicks more

Click-out rate:

29.9% (overall 41%)

Page 37: BIG DATA im E-Commerce - Potenziale und Herausforderungen des Web Mining am Bsp. eines Online-Shopping-Portals

Entscheidungsbaum

37

> 4,224 <= 4,224

> 4,916 <= 4,916 > 4,554 <= 4,554 > 0,347

> 5,939 > 0,347

> 0,896

<= 5,939 Nein

Nein

Ja <= 0,347

<= 0,896

<= 4,959 > 4,959

<= 0,347

<= 0,896 > 0,896

<= 0,690 > 0,690

Ja

PRODUKT_DAUER

DAUER PRODUKT

SUCHFELD

LOG_IN

DAUER_KLICK SUCHFELD DAUER

PRODUKT_DAUER KAMPAGNE DAUER PRODUKT

7 (n=692.612)

0: 68,66%

1: 31,37%

Quelle: Holsing 2012

Page 38: BIG DATA im E-Commerce - Potenziale und Herausforderungen des Web Mining am Bsp. eines Online-Shopping-Portals

Vergleich der Ergebnisse

38

Variablenkategorie Variable Log. Regr. Entscheidungsbaum MLP

Generell

LOG_IN +++ + +/++

KAMPAGNE n. u. + +

WOCHENENDE + o +

DAUER n. u. ++/+++ +++

DAUER_KLICK +++ ++ +++

PRODUKT +/++ ++/+++ +++

MAX_PRODUKT n. u. o ++

PRODUKT_DAUER n. u. +++ ++/+++

START +++ o +++

Suchfunktionen

SUCHFELD +++ ++ +++

SUCHE_GESCHLECHT ++ o ++

SUCHE_KATEGORIE + o ++

SUCHE_MARKE ++ o ++

SUCHE_PREIS ++ o ++

SUCHE_SALES ++ o ++

SUCHE_SHOP + o +

Social Shopping

RATING_PROD + o +

RATING_SHOP ++ o +

LISTE ++ o ++

STYLE +++ o ++

TAG ++ o ++

PROFIL + o ++

+++ starker Einfluss, ++ mittlerer Einfluss, + schwacher Einfluss, o kein Einfluss, n. u.: nicht untersucht

Page 39: BIG DATA im E-Commerce - Potenziale und Herausforderungen des Web Mining am Bsp. eines Online-Shopping-Portals

Vergleich der Methoden

39

Logistische Regression: Anforderungen an Modellprämissen höher,

empfindlich gegenüber Ausreißern, Signifikanzniveau vorhanden

Unabhängige Variablen: Anzahl verschieden

Methoden ergänzen sich

Kriterium Logistische

Regression Entscheidungsbaum Neuronales Netz

Anzahl Input-Variablen 18 22 22

Variablen im Modell 18 7 22

Klassifikationsgüte in % 63,40 71,58 73,24

Verständlichkeit

Bestimmung der

Wirkungsrichtung

der Einflussgrößen

durch (Effekt-)

Koeffizienten

Baumstruktur ist intuitiv

verständlich (hier

Klickprofile)

Black-Box-Charakter

Quelle: Holsing 2012

Page 40: BIG DATA im E-Commerce - Potenziale und Herausforderungen des Web Mining am Bsp. eines Online-Shopping-Portals

Implikationen für das Management einer SSC

40

Anzahl der Community-Mitglieder erhöhen

Abgabe von Ratings fördern

Trotz geringer Nutzung: Social Shopping-Funktionen wirken

signifikant auf Click-Out (negativ) und Stickiness (positiv)

Social Shopping-Funktionen separieren und wg. mögl. Reaktanz erklären

Aber: Social Shopping-Funktionen können wichtig sein für:

Attraktivität (Akquise und Loyalität)

Förderung Stöbern

Impulskäufe

Werbeerlöse (z.B. Banner und Textanzeigen (AdSense))

Verweildauer erhöhen (Differenzierung stöbern vs zielgerichtet)

Logfiles für Real-Time Analytics/ CRM/ Business Intelligence

Page 41: BIG DATA im E-Commerce - Potenziale und Herausforderungen des Web Mining am Bsp. eines Online-Shopping-Portals

Implikationen für das Management von

Online-Shops 41

Abgabe von Ratings fördern (für eigenen Shop/ Produkte)

Konzeption kanalspezifischer Pricing-Strategien

Aufmerksamkeit durch UGC (Listen, Styles)

Bsp.: Style Contests von Coach, Nike und Gucci

Coach: Innerhalb 1 Woche: 3.692 Styles, > 100.000 Likes,

> 200.000 Aufrufe Word-of-Mouth at it’s best!

Listen und Styles als Forecasting Tool nutzen

Integration in ‚Social CRM Strategy‘

Text Mining von nutzergenerierten Inhalten

Identifizierung Lead User

Tracking Conversion Rates

Page 42: BIG DATA im E-Commerce - Potenziale und Herausforderungen des Web Mining am Bsp. eines Online-Shopping-Portals

Fazit

42

Logfile-Analyse liefert neuartige Erkenntnisse zum

Kaufverhalten in SSCs

Grenzen: Logfiles stammen aus einer frühen

Entwicklungsphase, keine Wiederholungsbesuche erfasst,

Inhalt der Seiten nicht enthalten

Mögliche weitere Analyse: Einbezug von tatsächlichen

Käufen, Sequenzanalyse

Ökonomische Relevanz von BIG DATA steigt

Page 43: BIG DATA im E-Commerce - Potenziale und Herausforderungen des Web Mining am Bsp. eines Online-Shopping-Portals

DANKE FÜR IHRE

AUFMERKSAMKEIT!

FRAGEN?

KOMMENTARE?

www.lynx-ecommerce.de