Web-Mining Informationen für das...

12
Web Mining 3 One-to-one-Marketing und Customer Relationship Management (CRM) sind seit einigen Jahren domi- nierende Schlagworte im Marketing und in der Unternehmensführung. Nicht mehr die kurzfristige Akquisition neuer Kunden steht im Vordergrund, sondern die langfristige Pflege der Kundenbe- ziehung mit einer ausgeprägten Kontaktintensität zwischen Unternehmen und Kunde. Unter der Bezeichnung eCRM wird diese erfolgrei- che Strategie der ganzheitlichen und individuellen Kundenansprache nun auch auf das Internet über- tragen. Das hohe Potenzial von CRM im E- Commerce liegt dabei insbesondere in den vielfäl- tigen Möglichkeiten der individuellen und multi- medialen Interaktion mit dem einzelnen Kunden. Grundlage für die individuelle Kundenansprache ist das Wissen über den Kunden. Im Internet besteht die Möglichkeit, mehr als in allen anderen Medien aus dem Informations- und Kaufverhalten des Kunden auf einer Website seine Interessen abzuleiten. Auf Basis dieser Informationen können dem Kunden individuelle Inhalte präsentiert wer- den, die seinen persönlichen Bedürfnissen entspre- chen. Die Analyse des Kundenverhaltens im Netz mit Hilfe von fortschrittlichen Datenanalysever- fahren gewinnt unter der Bezeichnung Web Mining zunehmend an Bedeutung. Zur Unterstützung dieser Aufgabe existieren zahl- reiche Software-Produkte. Die Schwerpunkte die- ser Tools variieren von der Datenerhebung über einfache deskriptive Auswertungen und die Einbeziehung unterschiedlicher Analyseverfahren bis hin zur konkreten Umsetzung der gefundenen Informationen in personalisierten Angeboten. Die vorliegende Studie soll Unternehmen einen aus- führlichen und systematischen Überblick über die am Markt verfügbare Software geben. An dieser Stelle sei den hier vertretenen Anbietern gedankt, die an dem Gelingen der Studie mit ihrem großen Engagement einen erheblichen Vorwort Web-Mining Informationen für das E-Business Anteil haben. Bedanken möchten wir uns auch bei Johann von Groll für sein sehr großes Engagement bei der Erstellung dieser Studie. Für Anregungen und Verbesserungsvorschläge sind wir dankbar, da wir es uns zum Ziel gesetzt haben, den Nutzen dieser Studie kontinuierlich zu erhöhen. Lehrstuhl für ABWL und Wirtschaftsinformatik, Katholische Universität Eichstätt-Ingolstadt Auf der Schanz 49 85049 Ingolstadt Tel.: 08 41 / 93 71 871 Fax: 08 41 / 93 11 296 E-Mail: lehrstuhl.wirtschaftsinformatik@ ku-eichstaett.de Web: www.wi-ingolstadt.de Ihr Lehrstuhl-Team der Katholischen Universität Eichstätt-Ingolstadt

Transcript of Web-Mining Informationen für das...

Page 1: Web-Mining Informationen für das E-Businessprintarchiv.absatzwirtschaft.de/pdf/leseprobe_web_min.pdfWeb Mining 9 Grundlagen und Trends 1 Informationsbedarf im E-Business 9 2 Informationsgewinnung

Web Mining 3

One-to-one-Marketing und Customer RelationshipManagement (CRM) sind seit einigen Jahren domi-nierende Schlagworte im Marketing und in derUnternehmensführung. Nicht mehr die kurzfristigeAkquisition neuer Kunden steht im Vordergrund,sondern die langfristige Pflege der Kundenbe-ziehung mit einer ausgeprägten Kontaktintensitätzwischen Unternehmen und Kunde.Unter der Bezeichnung eCRM wird diese erfolgrei-che Strategie der ganzheitlichen und individuellenKundenansprache nun auch auf das Internet über-tragen. Das hohe Potenzial von CRM im E-Commerce liegt dabei insbesondere in den vielfäl-tigen Möglichkeiten der individuellen und multi-medialen Interaktion mit dem einzelnen Kunden.Grundlage für die individuelle Kundenanspracheist das Wissen über den Kunden. Im Internetbesteht die Möglichkeit, mehr als in allen anderenMedien aus dem Informations- und Kaufverhaltendes Kunden auf einer Website seine Interessenabzuleiten. Auf Basis dieser Informationen könnendem Kunden individuelle Inhalte präsentiert wer-den, die seinen persönlichen Bedürfnissen entspre-chen. Die Analyse des Kundenverhaltens im Netzmit Hilfe von fortschrittlichen Datenanalysever-fahren gewinnt unter der Bezeichnung WebMining zunehmend an Bedeutung.Zur Unterstützung dieser Aufgabe existieren zahl-reiche Software-Produkte. Die Schwerpunkte die-ser Tools variieren von der Datenerhebung übereinfache deskriptive Auswertungen und dieEinbeziehung unterschiedlicher Analyseverfahrenbis hin zur konkreten Umsetzung der gefundenenInformationen in personalisierten Angeboten. Dievorliegende Studie soll Unternehmen einen aus-führlichen und systematischen Überblick über dieam Markt verfügbare Software geben.An dieser Stelle sei den hier vertretenen Anbieterngedankt, die an dem Gelingen der Studie mitihrem großen Engagement einen erheblichen

Vorwort

Web-MiningInformationen für das

E-BusinessAnteil haben. Bedanken möchten wir uns auch beiJohann von Groll für sein sehr großes Engagementbei der Erstellung dieser Studie.Für Anregungen und Verbesserungsvorschlägesind wir dankbar, da wir es uns zum Ziel gesetzthaben, den Nutzen dieser Studie kontinuierlich zuerhöhen.

Lehrstuhl für ABWL und Wirtschaftsinformatik,Katholische Universität Eichstätt-IngolstadtAuf der Schanz 4985049 Ingolstadt

Tel.: 08 41 / 93 71 871Fax: 08 41 / 93 11 296E-Mail: [email protected]: www.wi-ingolstadt.de

Ihr Lehrstuhl-Team der Katholischen UniversitätEichstätt-Ingolstadt

Page 2: Web-Mining Informationen für das E-Businessprintarchiv.absatzwirtschaft.de/pdf/leseprobe_web_min.pdfWeb Mining 9 Grundlagen und Trends 1 Informationsbedarf im E-Business 9 2 Informationsgewinnung

Web Mining 5

Kapitel I – Grundlagen und TrendsWeb-Mining – den Internet-Usern auf der Spur.....................................................................9Dr. Hajo Hippner, Melanie Merzenich, Prof. Dr. Klaus D. Wilde,Katholische Universität Eichstätt-Ingolstadt

Interview mit Hans Peter Neeb (SBS) über Entwicklungen im Web Mining ................29

Fallbeispiel: Website-Analyse mit Web Usage Mining .......................................................35Andreas Englbrecht, Katholische Universität Eichstätt

Website Optimierung mit Hilfe von Web Usage Mining ...................................................43Dr. Frank Bensberg, Universität Münster

Potenziale und Herausforderungen der Personalisierung im Internet-Handel49 .......49Prof. Dr. Stefan Klein, Kai Riemer, Universität Münster

Web Controlling – Erfolgsmessung für den Internet-Auftritt..........................................63Dr. Gabriele Schäfer, mdm consult GmbH

Achtung Datenschutz!................................................................................................................67Thomas Nuthmann, Kanzlei Jaschinski, Biere & Brexl

Personalisierung und Erfolgskontrolle im Internet: Praxisbericht der NetBank AG..73Gerald Artelt, NetBank AG

Kapitel II – Die AnwenderbefragungWeb Mining in der Praxis ..........................................................................................................81Dr. Hajo Hippner, Melanie Merzenich, Prof. Dr. Klaus D. Wilde,Katholische Universität Eichstätt

Kapitel III – Die MarkübersichtAdvertorial ....................................................................................................................................97

Nutzungshinweise für die Studie..........................................................................................101

Marktübersicht ..........................................................................................................................103

Unternehmensprofile ...............................................................................................................203

Kapitel IV – ServiceGlossar .........................................................................................................................................233

Literatur.......................................................................................................................................242

Links .............................................................................................................................................245

Impressum ..................................................................................................................................247

Inhalt

Page 3: Web-Mining Informationen für das E-Businessprintarchiv.absatzwirtschaft.de/pdf/leseprobe_web_min.pdfWeb Mining 9 Grundlagen und Trends 1 Informationsbedarf im E-Business 9 2 Informationsgewinnung

Web Mining 9

Grundlagen und Trends

1 Informationsbedarf im E-Business 9

2 Informationsgewinnung durchWeb Mining 10

2.1 Logfile-Analyse und Web Mining 102.2 Richtungen des Web Mining 112.3 Der Web Mining Prozess 11

3 Datenerhebung 113.1 Datensammlung auf Web Server Ebene 123.1.1 Logfiles 123.1.2 Server Monitor 133.1.3 Network Monitor 143.1.4 Dynamische Seitenprogrammierung 143.1.5 Reverse Proxy Monitor 143.1.6 Application Monitor 153.2 Datensammlung auf Client-Ebene 153.2.1 Cookies 153.2.2 Remote Agents 15

4 Datenintegration 164.1 Mögliche Datenquellen 164.2 Datenschutz 16

5 Datenaufbereitung 175.1 Identifikation von Seitenaufrufen 175.2 Identifikation von Besuchern 175.3 Identifikation von Sitzungen 18

6 Data Warehouse und OLAP 18

7 Datenanalyse 217.1 Deskriptive Logfile-Analyse 217.2 Mustersuche: die Mining-Verfahren 227.2.1 Segmentierung: die Clusteranalyse 227.2.2 Assoziations- und Sequenzanalyse 227.2.3 Klassifikation: Entscheidungsbäume

und Neuronale Netze 237.2.4 Visualisierung und deskriptive Statistik 24

8 Umsetzung der Analyseergebnisse 25

9 Fazit 25

Literatur 27

Herkömmliche Webstatistiken sind nur einge-schränkt dazu geeignet, Informationen überNutzung und Nutzer einer Website zu liefern.Web Mining heißt die bessere Alternative.Dabei werden Verfahren des Data Mining zurAnalyse der Logfiles eingesetzt. Das Ziel sindtiefer gehende Erkenntnisse über die Zusam-mensetzung der Besucherschaft im Netz unddie Aufdeckung von Schwachstellen auf denWebsites.

1 Informationsbedarf im E-Business

E-Commerce und E-Business waren lange Zeit in all-ler Munde. Heute ist die Begeisterung nur noch ge-bremst. Negative Schlagzeilen über erfolglose bzw.gescheiterte Online-Projekte oder geschlosseneInternet-Start-ups haben die E-Commerce-Euphoriezunächst in ihre Schranken gewiesen. Gerade inZeiten, in denen im E-Business die Umsatzzahlenrückläufig sind, sollte man sich in diesem Bereichverstärkt auf klassische Geschäftskonzepte aus derOld Economy besinnen.Vor diesem Hintergrund gewinnt die Überlegungan Bedeutung, das traditionelle CRM-Konzept, al-so den Aufbau und die Pflege langfristig profi-tabler Kundenbeziehungen, auch auf das Internetzu übertragen. Viele Unternehmen vergessen,dass Prinzipien, die in der "realen Welt" gelten,zum Teil auch in der "virtuellen Welt" angewen-det werden könnten und sollten. Dies gilt insbe-sondere für Service- und Kundenorientierung, diesowohl on- als auch offline elementar für denGeschäftserfolg sind.Grundlage für eine erfolgreiche Kundenorientierungist das Wissen über den Kunden und seineBedürfnisse. Betreiber von Internet-Angeboten besit-zen jedoch oft nur wenige Informationen über dieEigenschaften ihrer Online-Besucher und dieWirkung ihres Internet-Auftrittes. Daher müssenwichtige Fragestellungen zum Internet-Auftritt oftunbeantwortet bleiben. Interessante Fragen stellensich beispielsweise zu der Zusammensetzung derBesucherschaft, der Wirkung von Online-Werbung,der Bewertung einzelner Seiteninhalte oder der

Web Mining – den Internet-Usern auf der Spur

Dr. Hajo Hippner, Melanie Merzenich und Prof. Dr. Klaus D. Wilde(Katholische Universtität Eichstätt)

Page 4: Web-Mining Informationen für das E-Businessprintarchiv.absatzwirtschaft.de/pdf/leseprobe_web_min.pdfWeb Mining 9 Grundlagen und Trends 1 Informationsbedarf im E-Business 9 2 Informationsgewinnung

10 Web Mining

Grundlagen und Trends

Untersuchung des Online-Kaufverhaltens derKunden (Reiner 2001, S. 7). Zusammensetzung der Besucherschaft:

Wie viele Besucher erhält meine Site? Woherkommen sie? Wie lange bleiben sie?Wie sehen typische Bewegungspfade aus? Wielassen sie sich verbessern?An welcher Stelle verlassen Besucher meine Siteund warum?Welche Profile haben meine wichtigsten Kun-densegmente?

Wirkung von Online-Werbung:

Welche Werbebanner erwecken das meiste In-teresse? Welche führen zu Käufen?An welcher Stelle sollten Banner platziert wer-den?Welche Partner (Werbung, Suchmaschinen etc.)generieren die meisten Besucher?Wie lange bleiben diese Besucher und wie vielewerden zu Käufern?

Bewertung der Seiteninhalte:

Für welche Inhalte interessieren sich die einzel-nen Kundensegmente?Welche Inhalte werden weniger beachtet undwarum?Wie lässt sich eine Personalisierung der Inhalteerreichen bzw. verbessern?

Online-Kaufverhalten der Besucher:

Wie unterscheiden sich Besucher von Käufern?Welche Produkte oder Kunden weisen Cross-Selling-Potenziale auf?Welches Verhalten auf der Site lässt auf Wie-derholungskäufe schließen?

Zur Beantwortung dieser Fragen stehen dem Be-treiber eines Online-Angebotes verschiedene Da-tenquellen und Analysemethoden zur Verfügung,welche im Folgenden näher erläutert werden.

2 Informationsgewinnung durch Web Mining

Für die Betreiber von Internet-Auftritten bestehenverschiedene Möglichkeiten, Wissen über Nutzungund Nutzer ihrer Websites zu generieren. Als Da-tenquelle stehen in erster Linie die aufgezeichne-ten Seitenaufrufe der Besucher zur Verfügung, auswelchen sich mit Hilfe geeigneter Analyseverfah-ren die Verhaltensweisen der Besucher und derErfolg des Internet-Auftritts ableiten lassen.

2.1 Logfile-Analyse und Web Mining

Die herkömmliche Vorgehensweise zur Auswer-tung der Internet-Nutzungsdaten besteht in derErstellung deskriptiver Statistiken (Logfile-Analyse). Die Ergebnisse einer Logfile-Analyse ge-ben erste wichtige Anhaltspunkte zur Nutzung ei-ner Site durch die Besucher; sie liefern jedochnoch keine Informationen zu individuellenVerhaltensweisen und Interessen der Online-Nutzer. Insbesondere sind sie nicht in der Lage,selbständig Muster in den Nutzungsdaten aufzu-finden. Gerade derartige Muster im Verhalten derOnlinekunden können im zunächst anonymenMedium Internet jedoch von hoher Bedeutungfür die Informationsgewinnung sein. Daher bietetes sich an, automatische Mustererkennungs-Verfahren (Verfahren des Data Mining) aufInternet-Daten anzuwenden, um tiefergehendeInformationen über die Besucher einer Websitezu erhalten (Bensberg/Weiß 1999, S. 426).Zur Unterstützung derartiger Analysen existierenverschiedene Arten von Softwareprodukten.Diese weisen unterschiedliche Schwerpunkte auf.Die erste Generation von Tools zur Analyse vonInternet-Nutzungsdaten enthielt hauptsächlichFunktionalitäten zur rein deskriptiven Logfile-Analyse. In einem ständigen Entwicklungsprozessintegrieren diese Tools jedoch immer umfassen-dere Analysefunktionalitäten.In jüngerer Zeit entwickeln auch traditionelleAnbieter von Data Mining-Software spezielle Zu-satzfunktionalitäten, um ihre Analysetechniken fürdie Auswertung der Daten aus dem Web nutzbar zumachen. Neue Anbieter am Markt konzentrieren sichzum Teil direkt auf die Entwicklung einer reinen WebMining-Software, welche den kompletten Analyse-prozess von der Datenerhebung und -analyse bis zurUmsetzung der Ergebnisse unterstützt.Zur Umsetzung der Ergebnisse – insbesondere für diePersonalisierung – haben sich wiederum eigene Toolsherausgebildet, die die Aufgabe haben, den Internet-Nutzern personalisierte Inhalte zur Verfügung zustellen. Zur Generierung der Personalisierungsregelngreifen auch diese Tools häufig auf die Ergebnisse desWeb Mining zurück oder beinhalten sogar eigeneMining-Komponenten.Die vorangegangenen Ausführungen zeigen, dassdie verschiedenen Arten der Analyse-Tools zwaraus ganz unterschiedlichen Richtungen kommen,sich aber durch eine ständige Erweiterung ihrerFunktionalitäten immer mehr einander anglei-chen. Aus diesem Grund wird in dieser Studie be-wusst auf eine klare Abgrenzung zwischen dengenannten Richtungen verzichtet. Um dennocheinen Überblick über die enthaltenen Funktiona-litäten sowie die Kernkompetenzen der einzelnen

Page 5: Web-Mining Informationen für das E-Businessprintarchiv.absatzwirtschaft.de/pdf/leseprobe_web_min.pdfWeb Mining 9 Grundlagen und Trends 1 Informationsbedarf im E-Business 9 2 Informationsgewinnung

Web Mining 11

Grundlagen und Trends

Softwareprodukte zu erhalten, stellen wir unsererMarktübersicht eine entsprechende Einordnungder Produkte voraus.

2.2 Richtungen des Web Mining

Der Begriff Web Mining bezeichnet zunächst dieallgemeine Anwendung von Verfahren des DataMining auf Datenstrukturen des Internet (Zaiane2000). Dies beinhaltet sowohl die Analyse vonSeiteninhalten (Web Content Mining) undSeitenstrukturen (Web Structure Mining) als auchdie Untersuchung des Nutzerverhaltens (WebUsage Mining; vgl. Abbildung 1).

Web Content Mining befasst sich mit derAnalyse des Inhaltes von Websites. Zielsetzung istdie Erleichterung der Suche nach Informationenim Netz. Aufgabengebiete sind beispielsweisedie Klassifizierung und Gruppierung von Online-Dokumenten oder das Auffinden von Dokumen-ten nach bestimmten Suchbegriffen. Dabei kom-men insbesondere Verfahren des Text Miningzum Einsatz (Bensberg/Weiß 1999, S. 426 f.).Web Structure Mining untersucht die Anord-nung einzelner Elemente innerhalb einerWebsite (intrapage structure information) sowiedie Anordnung verschiedener Seiten zueinander(interpage structure information). Von besonde-rem Interesse sind dabei die Verweise von einerWebsite auf eine andere mittels so genannterHyper Links. Die verlinkten Websites sind häufiginhaltlich verwandt (Srivastava et al. 2000).Web Usage Mining beschäftigt sich mit demVerhalten von Internet-Nutzern. Bei dieserAusprägungsform des Web Mining werdenData Mining Methoden auf die Logfiles desWeb Servers angewandt, um Aufschlüsse überVerhaltensmuster und Interessen der Online-Kunden zu erhalten (Srivastava et al. 2000).

Die beiden erstgenannten Richtungen des WebMining tragen nicht dazu bei, Informationen überOnline-Kunden zu gewinnen und sollen daherhier nicht näher betrachtet werden.

2.3 Der Web Mining Prozess

Der Web Mining Prozess gliedert sich in die inAbbildung 2 dargestellten Schritte, welche hier

kurz umrissen und in den nachfolgenden Kapitelnausführlich dargestellt werden.In Abhängigkeit von der Aufgabenstellung wer-den die heranzuziehenden Daten ausgewählt. Primäre Datenquelle des Web Usage Mining sinddie Web Logfiles; darüber hinaus können jedochauch weitere Daten einbezogen werden. DieDatenaufbereitung zerfällt in die beiden Schritteder Datenbereinigung und der Identifikation vonNutzern und Sitzungen (zusammenhängenderBesuch eines Nutzers auf einer Website). DieseSchritte sind von elementarer Bedeutung für dieAnalyseergebnisse; gleichzeitig nehmen sie aberauch die meiste Zeit innerhalb des Prozesses inAnspruch (Zaiane et al. 1998, S. 27). Werden zu-sätzliche Informationen zur Analyse herangezo-gen, erfolgt im nächsten Schritt eine Integrationder verschiedenen Datenquellen. Aus der aufbe-reiteten Datenbasis werden mit Hilfe von DataMining-Verfahren Muster extrahiert, welche ab-schließend bewertet und interpretiert werden(Cooley et al. 1997). Abbildung 3 stellt denProzess des Web Mining detailliert dar.Die in dieser Studie untersuchten Tools unter-scheiden sich insbesondere durch die vielfältigenMöglichkeiten zur Datenerhebung, Datenaufbe-reitung und Datenanalyse sowie zur Umsetzungder Ergebnisse. Daher sollen diese Phasen im fol-genden näher betrachtet werden.

3 Datenerhebung

Am Anfang des Web Mining-Prozesses steht dieErhebung der Web-Daten, die in die Analyse ein-fließen sollen. Diese Daten können sowohl aufder Ebene des Web Servers (serverseitig) als auchauf dem Rechner des Besuchers (clientseitig) er-hoben werden (Srivastava et al. 2000, S. 12).

�����������

��������

���� ���� �������

���������������

�������������

��������������� �����

Abbildung 1: Richtungen des Web Mining

������������

��������� �����

���� �����

��������� �����

��� � �������

Abbildung 2: Ablauf der Web Mining-Analyse

Page 6: Web-Mining Informationen für das E-Businessprintarchiv.absatzwirtschaft.de/pdf/leseprobe_web_min.pdfWeb Mining 9 Grundlagen und Trends 1 Informationsbedarf im E-Business 9 2 Informationsgewinnung

Web Mining 81

Anwenderbefragung

Insbesondere im deutschsprachigen Raum sind bis-her nur wenige Informationen zu durchgeführtenWeb Mining-Projekten erhältlich. Der Lehrstuhl fürWirtschaftsinformatik der Katholischen UniversitätEichstätt-Ingolstadt untersuchte daher in Zusam-menarbeit mit der Zeitschrift "absatzwirtschaft"den aktuellen Stand der Auswertung von Logfilesdurch deutsche Unternehmen.

Die Erhebung sollte empirische Erkenntnisse zuden folgenden Fragestellungen erbringen:

Werden Logfile-Daten in der betrieblichen Praxisgespeichert und ausgewertet?Werden die Ergebnisse zur Verbesserung desInternet-Auftrittes genutzt?Werden Verfahren des Web Mining eingesetztoder ist dieser Einsatz geplant?Wie könnte ein typisches Web Mining-Projekt inder Praxis aussehen?Welche Gründe sprechen gegen den Einsatz vonWeb Mining?

Die Datenerhebung wurde anhand eines elektroni-schen Fragebogens per E-Mail durchgeführt. AlsZielgruppe der Studie wurden 650 Unternehmenmit der folgenden Zusammensetzung ausgewählt:

Die 500 größten Unternehmen Deutschlands. Die 50 größten Banken Deutschlands. Die 20 größten Versicherungen Deutschlands. Die 50 größten plus 30 ausgewählte Internet-Un-ternehmen in Deutschland.

Der Erhebungszeitraum erstreckte sich über dieMonate Januar bis Februar 2001. Mit einem Rück-lauf von elf Prozent konnten schließlich 72 ausge-füllte Fragebogen zur Auswertung herangezogenwerden. Bei den Adressaten der Studie handelt essich überwiegend um Entscheidungsträger aus demInternet-/Marketing-Bereich der Unternehmen.

Der Fragebogen

Der zu Grunde liegende Fragebogen untergliedertsich in vier Teile: Der erste Teil umfasst allgemeineFragen zum Unternehmen wie Branche, Größe,Distributionsorgane und Bedeutung des Internet.Im zweiten Teil wird erfasst, wie die Bedeutungvon Web Mining für verschiedene Funktionen ein-geschätzt wird und welche Alternativen zum Web

Mining gesehen werden. Der dritte Teil beschäftigtsich mit der Art und Weise der Erfassung undAnalyse von Webserver-Logfiles sowie mit derVerwendung der gewonnenen Informationen.Der vierte Teil unterscheidet zwischen Unterneh-men, die bereits erste Web Mining-Projekte durch-geführt oder geplant haben sowie denjenigen, wel-che die Anwendung von Web Mining in absehbarerZeit nicht planen. Besonderes Interesse gilt hier derersten Gruppe, welche zu den einzelnen Phasenund Elementen der durchgeführten/geplantenWeb Mining-Projekte befragt wird. Unter anderemwird erhoben, welche Abteilungen in den Projekt-verlauf involviert sind, welche Daten und Verfahrenzur Analyse herangezogen, welche Ziele mit demProjekt verfolgt werden und welche Probleme beider Planung und Durchführung auftreten.

Unternehmensinformationen

Web Mining in der PraxisDr. Hajo Hippner, Melanie Merzenich und Prof. Dr. Klaus D. Wilde

(Katholische Universität Eichstätt)

Abbildung 1: Unternehmensgröße nachAnzahl der Mitarbeiter

[in Prozent der befragten Unternehmen]

10

25

65

0

10

20

30

40

50

60

70

1-100 101-1000 >1000

Abbildung 2: Branchenzugehörigkeit[in Prozent der befragten Unternehmen]

Konsumgüter11%

Handel10%

Transport + Verkehr

6%

Medien +Telekomm.

13%

Sonstiges17%

Bank + Versicherung

17%

Invest.güter11%

Produkt.güter15%

Page 7: Web-Mining Informationen für das E-Businessprintarchiv.absatzwirtschaft.de/pdf/leseprobe_web_min.pdfWeb Mining 9 Grundlagen und Trends 1 Informationsbedarf im E-Business 9 2 Informationsgewinnung

82 Web Mining

Anwenderbefragung

Abbildung 1 und Abbildung 2 zeigen die Zusam-mensetzung der befragten Unternehmen nachGröße und Branchenzugehörigkeit. Aufgrund derAuswahl der Zielgruppe überwiegen Unterneh-men mit mehr als 1 000 Mitarbeitern. Die relativgleichmäßige Verteilung der Befragten auf die vor-gegebenen Branchen wurde nicht bewusst herbei-geführt, sollte aber von Vorteil für die Aussagefä-higkeit der Studie sein. Auch die Ausrichtung derverschiedenen Unternehmen auf den "Business-"oder "Consumer-"Bereich weist eine ziemlichgleichmäßige Verteilung auf (Abbildung 3).

Etwa zwei Drittel der befragten Unternehmennutzen das Internet als Distributionskanal. In denmeisten Fällen sind daneben noch weitere Distri-butionskanäle vorhanden (Abbildung 4). Für Infor-mation, Kommunikation und Imagebildung hatdas Internet bereits heute eine hohe Bedeutung,welche zukünftig weiter ansteigen wird. DieBedeutung für Service, Vertrieb und Einkauf wirdbisher als eher gering eingeschätzt. Für die Zukunfterwarten die Befragten jedoch auch für dieseFunktionen eine stark wachsende Bedeutung(Abbildung 5).Weniger als 50 Prozent der Unternehmen weisen

bereits Erfahrung im Einsatz von Data Mining auf(der Anwendung von Verfahren der automati-schen Mustererkennung auf große Datenbestän-de, vgl. Hippner et al. 2000; Abbildung 6). In Bezugauf Text Mining (die Anwendung von Data Mining-Verfahren auf Textdokumente, vgl. Hippner et al.2000) liegt diese Quote sogar unter 25 Prozent(Abbildung 7). Allerdings planen 15 Prozent bzw.13 Prozent den Einsatz dieser Verfahren (Abbil-dung 6 und 7).

Abbildung 3: Unternehmensausrichtung[in Prozent der befragten Unternehmen]

27

14

27

15

17

0 5 10 15 20 25 30

Ausschließlich B2B

Überwiegend B2B

Beide Bereichevon Bedeutung

Überwiegend B2C

AusschließlichB2C

Abbildung 4: Distributionskanal Internet[in Prozent der befragten Unternehmen]

Ausschließl.10%

Nicht vorhanden

33%Vorhanden

57%

Abbildung 5: Bedeutung des Internet fürverschiedene Funktionen

[Mittelwerte; Skala von 1 = "keine Bedeutung" bis 5 = "hohe Bedeutung"]

3,9 3,83,5

2,92,5

2,2

1,5

2,0

2,5

3,0

3,5

4,0

4,5

5,0

Information Imagebildung Vertrieb

Zukünftige BedeutungHeutige Bedeutung4,7 4,7

4,3 4,2

3,83,7

Kommunikation Service Einkauf

Abbildung 6: Erfahrung mit Data Mining[in Prozent der befragten Unternehmen]

Erfahrung47%

Keine Erfahrung

38%

Einsatz geplant

15%

Abbildung 7: Erfahrung mit Text Mining[in Prozent der befragten Unternehmen]

Einsatz geplant

13%

Keine Erfahrung

66%

Erfahrung21%

Page 8: Web-Mining Informationen für das E-Businessprintarchiv.absatzwirtschaft.de/pdf/leseprobe_web_min.pdfWeb Mining 9 Grundlagen und Trends 1 Informationsbedarf im E-Business 9 2 Informationsgewinnung

Web Mining 129

Marktübersicht

��������

������ ��������

��������������������������� ����

��������������������

����������������� ��! ��

�������������! ���" � ��#��� ��� � ��� �$�$��

��� �$�$���

������ ������

�������������

�� ��������������

��������������

�������������������� ���

������������������������������������

��$�����%���������&'��($���

��$�����%���������&'��($����

����#�����

����#������

)��$����$�����

� �����������������

�*+�$�����,����������-$���

������.�������/ ���/���!#������*+�$*+�$�!0������

��*+�$*+�$�!0�������

��*+�$*+�$�!0��������

�����.�����"��� �! �����.�����$�

���%�*�

�����.�����! ��� �/#� �)�"����

Page 9: Web-Mining Informationen für das E-Businessprintarchiv.absatzwirtschaft.de/pdf/leseprobe_web_min.pdfWeb Mining 9 Grundlagen und Trends 1 Informationsbedarf im E-Business 9 2 Informationsgewinnung

130 Web Mining

Marktübersicht

'**������������

10 /�&�/���$

'**������������

10 /�&�12

'��$$���������

����������*3

'����*+����(�

1�����10 /

���3��'�� '!�������! 1

�������������

��������� ������� ��������� ��!�������� ��"��� �� − �� ��

�#�$%����� �� �� − −�#�$&�� � �� �� − −��"���������'�(%$���������������)��$���� �� �� �� ��

'������*��������+���������������,% �� �� �� ��

�� �������������������������

(������������ � �� �� �� ��

��������� ��-�������� − − �� ��

(*��� ������������������-�������� �� �� �� −.��!������ ��� ���������� �� �� �� ��

������������������������������������ ����

/�������������������� �� �� �� −'���$,�0����� �� �� �� ��

������������,����� �� �� − ��

����������������1� �� �� − ��

�+$������� �� �� �� −,������ �� �� − ��

��������� �� �� �� ��

���!��� �� �� �� ��

���� ���������������������������������+��� �� �� �� ��

�������������������� ���

�+$������� �� �� �� ��

-����������� ������%����$����� �� � �� ��

�,%$,������ � � �� ��

&����� �� �� − ��

.��������������� �� �� �� −-���������������� �� � �� ��

�������2�"��������)�� �����"!�� ������������������ ����

!3 ����������������− � �� ��

��������.��� ��� −�����.��4����

&���$5����

6�)7− −

������������������������������������

����� ��8�����������+����.�!� �� �� − −������$�� �� �� − ��

���$5�� �� �� �� ��

������������$5�� − �� �� ��

(*��� �������$5��$)����"���������� �� �� �� ��

(�������.��!3���������" − − − ��

+�����������3������

$���������3�����+��������� ��8�� − − − −$���������3�����+������������� ����������3����� − − − −

��������.��� ��� − − − −

Page 10: Web-Mining Informationen für das E-Businessprintarchiv.absatzwirtschaft.de/pdf/leseprobe_web_min.pdfWeb Mining 9 Grundlagen und Trends 1 Informationsbedarf im E-Business 9 2 Informationsgewinnung

Web Mining 131

Marktübersicht

��$$�,�4���0��(�

10 /

��$��$$�" 5�*$�

���$*+����10 /

�6��(��&��$��$$�

�������*��10 /

��#����$*+����

10 /�7����0���6�

10 /

#�*��$���10 /

#���� �10 /

#� �������������3

���10 /���������

��%�$��

�1��$�$�

���$*+����10 /

� �� �� �� − � − �� ��

� �� �� �� �� 9::9 �� �� ��

� �� �� 9::9 �� 9::9 �� � ��

� �� �� 9::9 �� �� �� � ��

� �� �� � �� �� �� � ��

� �� �� �� �� �� − � ��

� − − − − �� − � ��

�� − − �� �� �� − � ��

� − �� �� �� �� �� � ��

− �� �� �� − �� �� � ��

− �� �� �� �� �� �� � ��

− �� �� �� − �� �� � ��

− �� �� �� �� �� �� � ��

− �� �� �� �� − �� � ��

− �� �� �� �� �� �� � ��

− �� �� �� �� �� �� � ��

− �� �� �� �� �� �� � ��

− �� �� �� �� �� �� � ��

�� �� �� �� �� − �� �� ��

�� �� �� �� − � �� �� ��

− �� �� � �� �� �� �� ��

− �� − �� �� 9::9 �� �� ��

− �� �� � − − − �� �

− �� �� �� �� 9::9 �� �� ��

− �� − − �� � �� � ��

− − − − − − − − −

� �� �� � �� �� �� � ��

� �� �� �� �� �� �� � ��

� �� �� �� �� �� �� �� ��

� �� 9::9 − − � − � −� �� �� �� − �� �� �� ��

� �� − − − � − � −

�� �� − − − � − �� −� �� − − − � − � −

− − − − − − − − −

Page 11: Web-Mining Informationen für das E-Businessprintarchiv.absatzwirtschaft.de/pdf/leseprobe_web_min.pdfWeb Mining 9 Grundlagen und Trends 1 Informationsbedarf im E-Business 9 2 Informationsgewinnung

Web Mining 233

Service

A

Ad View/Ad ImpressionAd View (auch Ad Impression) ist ein Messwert fürden Erfolg eines Werbebanners im World WideWeb. Man bezeichnet damit die Zahl der Nutzer,die in einem bestimmten Zeitraum ein bestimm-tes Werbe-Banner gesehen haben (Sichtkon-takte).(Quelle: http://netlexikon.akademie.de)

Ad Clicks/Click-ThroughAd Clicks (auch Click-Through) ist eine Maßzahl,mit der jeder Nutzer gezählt wird, der einenWerbebanner anklickt und damit auf die Websiteder Werbenden gelangt.(Quelle: Dastani, P. (1998): Online Mining, in: Link,J. (Hrsg.): Wettbewerbsvorteile durch OnlineMarketing - Die strategischen Perspektiven elek-tronischer Märkte, Berlin, S.277.)

Application CollectorApplication Collectors sammeln Daten direkt vomApplication Server. Sie zeichnen die Interaktionder Nutzer mit den Seitenelementen auf undkönnen so z.B. Auskunft über das Entfernen oderHinzufügen von Waren in den Warenkorb geben.Es können so auch User- und Session-ID aufge-zeichnet werden.(Quelle: WCM Online (2000): Web Personalisie-rung - Umsetzung des One-to-One Marketing imInternet, in: Web Personalisierung - Hersteller undDienstleister von Web Personalisierungs-Lösun-gen, Düsseldorf, 2000, S.11.)

ASCIIAmerican Standard Code for InformationInterchange. Ein amerikanischer Standard-Code,um Buchstaben und Zahlen zu übermitteln. Erkann jedoch keine Sonderzeichen übertragen,ebenso wenig die Umlaute ä, ö, ü sowie das ß.ASCII ist nach wie vor Standard bei plattform-übergreifenden Anwendungen wie E-Mails undim Usenet.(Quelle: http://www.team-suchant.de/media)

ASPApplication Service Providing bzw. ApplicationService Provider. Der Provider stellt seinen Kundendie Nutzung von Software-Anwendungen zurVerfügung, die auf der Hardware und der System-umgebung des Providers betrieben werden. Der

Zugriff der ASP-Kunden auf diese Anwendungerfolgt über das Internet oder speziell eingerichte-te Netzanschlüsse. (Quelle: http://www.7d.net/deutsch/basics/glossar)

AssoziationsanalyseAssoziationsmodelle prüfen, inwieweit die Werteeiner bestimmten Variablen von einer anderenVariablen abhängen. Die Paradeanwendung die-ser Methode ist die so genannte Warenkorb-Ana-lyse zur Untersuchung von Kaufmustern. Im WebMining eignet sich die Assoziationsanalyse insbe-sondere dazu, Seiten zu identifizieren, die häufiggemeinsam innerhalb einer Sitzung aufgerufenwerden.(Quelle: Binder, U. (2001): Blick in die Zukunft perData Mining. In: InfoWeek.ch 13/2001.)

B

BannerWerbeeinblendungen auf einer Website. Dabeihaben sich die dynamischen Banner durchgesetzt,die einen Hyperlink zur Seite des Werbetreiben-den herstellen.

Bayes-NetzeS. Kausale Netze

BrowserSoftware, die die Navigation im WWW ermög-licht. Hierfür wird der HTML-Code in die Darstel-lung für den Bildschirm umgesetzt. Die grafischeOberfläche des Browsers ermöglicht es, Texte,Bilder und Grafiken zu zeigen und erleichtert dieSuche im Netz. Die bekanntesten Browser sindder Internet Explorer von Microsoft und derNetscape Navigator.(Quelle: http://www.buurman.de/Glossar_voraus-wahl.html)

C

CacheEin Cache ist ein Zwischenspeicher, der eingesetztwird, um den Zugriff auf Daten und das Speichernvon Daten zu beschleunigen. Der so genannteProzessor-Cache beschleunigt den Zugriff der CPUauf den Arbeitsspeicher, und der Disk-Cachebeschleunigt den Zugriff auf Datenträger wieFestplatte oder Diskette. (Quelle: http://www.team-suchant.de/media)

Glossar

Page 12: Web-Mining Informationen für das E-Businessprintarchiv.absatzwirtschaft.de/pdf/leseprobe_web_min.pdfWeb Mining 9 Grundlagen und Trends 1 Informationsbedarf im E-Business 9 2 Informationsgewinnung

Web Mining

Bensberg, F. (2001): Web Log Mining alsInstrument der Marketingforschung - Ein system-gestaltender Ansatz für internetbasierte Märkte.Wiesbaden.

Bensberg, F.; Weiß, T. (1999): Web Log Mining alsMarktforschungsinstrument für das World WideWeb. In: Wirtschaftsinformatik, Nr. 41, S. 426-432.

Kimball, R.; Merz, R. (2000): The Data Web-house Toolkit - Building the Web-Enabled DataWarehouse. New York.

Mayer, R. ; Bensberg, F.; Hukemann, A.(2001): Web Log Mining als Controlling-instru-ment für Online-Shops. In: Controlling, Nr. 3, S. 157-165.

Mena, J. (2001): WebMining for Profit: E-Business Optimization. Butterworth-Heinemann.

Mena, J. (2000): Data Mining und E-Commerce -Wie Sie Ihre Online-Kunden besser kennen lernenund gezielter ansprechen. Düsseldorf.

Merzenich, M. (2001): Web Mining - Auf derSuche nach aussagekräftigen Daten. In: Frielitz,C.; Hippner, H.; Martin, S.; Wilde, K. D. (2001):Marktstudie eCRM 2001. Sonderpublikationabsatzwirtschaft, S. 45-51.

Thuraisingham, B. (2000): Web Data Manage-ment and Electronic Commerce. Boca Raton.

Data Mining / OLAP

Alpar, P.; Niedereichholz, J. (Hrsg.) (2000): DataMining im praktischen Einsatz - Verfahren undAnwendungsfälle für Marketing, Vertrieb, Control-ling und Kundenunterstützung. Braunschweig/Wiesbaden.

Berry, M.J.A.; Linoff, G.S. (2000): MasteringData Mining. New York.

Chamoni, P.; Gluchowski, P. (Hrsg.) (1998):Analytische Informationssysteme - Data Ware-house, On-Line Analytical Processing, DataMining. Berlin.

Codd, E.; Codd, S.; Sally, C. (1993): ProvidingOLAP (on-line analytical processing) to user-ana-lysts - an IT mandat, White Paper, E.F. Codd &Associates.

Hippner, H.; Küsters, U., Meyer, M.; Wilde, K.D. (2000): Handbuch Data Mining im Marketing- Knowledge Discovery in Marketing Databases.Wiesbaden.

Lusti, M. (1999): Data Warehousing und DataMining - Eine Einführung in entschei-dungsunter-stützende Systeme. Berlin.

Nakhaeizadeh, G. (Hrsg.): Data Mining - Theore-tische Aspekte und Anwendungen. Heidelberg.

Schinzer, H. Bange, C.; Mertens, H.; (1999): DataWarehouse und Data Mining - MarktführendeProdukte im Vergleich. 2. Auflage, München.

Personalisierung

Buxel, H. (2001): Customer Profiling im Electro-nic Commerce - Methodische Grundlagen, An-wendungsprobleme und Managementimplika-tionen. Herzogenrath.

Klein, S.; Güler, S.; Lederbogen, K. (2000):Personalisierung im elektronischen Handel. In:WISU 29 (2000) 1, S. 88-94.

Höhl, M. (1999): One-to-One-Marketing. In: Wirt-schaftsinformatik 41 (1999) 1, S. 74-76.

Runte, M. (2000): Personalisierung im Internet:Individualisierte Angebote mit CollaborativeFiltering. Wiesbaden.

eCRM

Eggert, A.; Fassott, G. (Hrsg.) (2001):Electronic Customer Relationship Management.Management der Kundenbeziehungen im Inter-net-Zeitalter. Stuttgart.

Frielitz, C.; Hippner, H.; Martin, S.; Wilde, K.D. (2001): eCRM - Kundenbindung im Internet.In: Frielitz, C.; Hippner, H.; Martin, S.; Wilde, K. D.(2001): Marktstudie eCRM 2001. Sonderpublika-tion absatzwirtschaft, S. 9-36.

242 Web Mining

Service

Literatur