Analyse sozialer Bindungen - Über Netzwerkdaten zu mehr Kundenwissen

22
Analyse sozialer Bindungen Über Netzwerkdaten zu mehr Kundenwissen mayato White Paper von Peter Gerngross

description

Durch Web-Communities wie Facebook oder Xing sind soziale Netzwerke in aller Munde. Die Methoden zur Analyse der Netzwerkdaten („Social Network Analysis“, kurz SNA) werden immer ausgereifter. Auch große Software-Häuser bieten inzwischen entsprechende Lösungen an. Unternehmen können von dieser Entwicklung profitieren, indem sie soziale Verbindungen ihrer Kunden gezielt analysieren.

Transcript of Analyse sozialer Bindungen - Über Netzwerkdaten zu mehr Kundenwissen

Page 1: Analyse sozialer Bindungen - Über Netzwerkdaten zu mehr Kundenwissen

Analyse sozialer Bindungen

Über Netzwerkdaten zu mehr Kundenwissen

mayato White Paper von Peter Gerngross

Page 2: Analyse sozialer Bindungen - Über Netzwerkdaten zu mehr Kundenwissen

Analyse sozialer Bindungen: Über Netzwerkdaten zu mehr Kundenwissen

Seite 20

Notizen

Page 3: Analyse sozialer Bindungen - Über Netzwerkdaten zu mehr Kundenwissen

Analyse sozialer Bindungen: Über Netzwerkdaten zu mehr Kundenwissen

© mayato® GmbH. Alle Rechte vorbehalten. Seite 1

Analyse sozialer Bindungen:

Über Netzwerkdaten zu mehr Kundenwissen

von Peter Gerngross

Kurzzusammenfassung

Durch Web-Communities wie Facebook oder Xing sind soziale Netzwerke in aller Munde. Die Methoden

zur Analyse der Netzwerkdaten („Social Network Analysis“, kurz SNA) werden immer ausgereifter. Auch

große Software-Häuser bieten inzwischen entsprechende Lösungen an. Unternehmen können von dieser

Entwicklung profitieren, indem sie soziale Verbindungen ihrer Kunden gezielt analysieren.

Die durch SNA gewonnenen Informationen können in vielen Bereichen genutzt werden: Im Marketing

können mit SNA-Methoden beispielsweise Multiplikatoren im Kundenbestand identifiziert werden. Die

zentrale Steuerungsgröße Kundenwert kann mit Hilfe von Netzwerk-Analysen genauer bestimmt werden.

Bei der Risikosteuerung und im Betrugsmanagement kann die SNA ebenfalls einen wichtigen Beitrag leis-

ten. So können z.B. Ausfallrisiken im Großkundenbereich oder Betrugsringe mit SNA neu evaluiert bzw.

ermittelt werden. Bei der Entwicklung von Data-Mining-Modellen tragen durch SNA gewonnene Kennzah-

len zur Modellqualität und somit zur Vorhersage-Genauigkeit der Modelle bei.

Das Whitepaper geht nach einer kurzen Einführung in die Analyse sozialer Netzwerke auf konkrete An-

wendungsmöglichkeiten im Unternehmen ein und zeigt auf, welche bereits vorhandenen Datenquellen

für diesen Zweck genutzt werden können. In den zwei abschließenden Kapiteln werden die IT-technische

Umsetzung der SNA sowie einige Methoden und Kennzahlen im Detail erläutert.

Page 4: Analyse sozialer Bindungen - Über Netzwerkdaten zu mehr Kundenwissen

Analyse sozialer Bindungen: Über Netzwerkdaten zu mehr Kundenwissen

Seite 2 © mayato® GmbH. Alle Rechte vorbehalten.

1 Einführung

Durch Web-Communities wie Facebook oder Xing sind (virtuelle) soziale Netzwerke in aller Munde. Die Methoden zur Analyse der Netzwerkdaten, die seit den 1950er Jahren entwickelt worden waren, werden immer ausgereifter. Wie können sich Un-ternehmen diese Entwicklungen zunutze machen, auch wenn sie keine großen Internet-Communities unterhalten?

Unternehmen betrachten ihre Kunden heute zu-meist als Individuen, sei es im Privat- oder im Firmenkundengeschäft. Der einzelne Kunde wird isoliert gesehen, während seine Interaktionen und Kommunikation mit anderen Kunden weder im Marketing noch in der Kundenbetreuung oder im Risikomanagement berücksichtigt werden.

In den Kundenbeständen größerer Unternehmen sind jedoch Netzwerke vorhanden. Kunden kennen sich, sind verwandt oder befreundet und kommu-nizieren miteinander. Sie sprechen auch über die Erfahrungen, die sie als Kunden mit dem Unterneh-men machen, über Werbung, die sie erhalten, über neue Produkte und Angebote. Firmenkunden kön-nen wirtschaftlich verbunden sein, z.B. über Kon-zernverflechtungen und Beteiligungen, aber auch durch Geschäftsbeziehungen. Diese Netzwerke gilt es zu identifizieren und zu nutzen.

Die identifizierten Strukturen können beispiels-weise genutzt werden, um das Potential einzelner

Kunden als Multiplikatoren für das Marketing zu nutzen. Multiplikatoren sind Personen, die auf-grund ihres großen Netzwerks oder ihres Einflusses auf Bekannte und Freunde geeignet sind, Informati-onen und Angebote zu verbreiten. Weitere Anwen-dungen von Netzwerken ergeben sich im Risikoma-nagement – Microcredits sind ein Beispiel dafür, wie Netzwerke zur Risikoreduzierung genutzt wer-den – sowie bei der Kundenwertsteuerung.

Es gibt viele Möglichkeiten, Verbindungen zwischen Kunden festzustellen. Im Privatkundenbestand ei-ner Bank etwa kann man Netzwerke identifizieren, indem man Gemeinschaftskonten, Bevollmächti-gungen und Freistellungsauftragspartner betrach-tet. Bei Telekommunikationsunternehmen können Telefon- und SMS-Verbindungsdaten genutzt wer-den. Über Namens- und Adressanalysen werden Fa-milienverbünde und Hausgemeinschaften identifi-ziert. Kundenempfehlungsprogramme liefern gute Hinweise auf persönliche Bekanntschaften.

In diesem White Paper wird beschrieben, auf wel-che Weise die Analyse von Netzwerken für das Un-ternehmen Nutzen stiften kann. Es wird aufgezeigt, welche Arten von Beziehungen zwischen Kunden es geben kann und aus welchen Datenquellen diese ermittelt werden können. Nach der Beschreibung eines möglichen Datenmodells zur Speicherung von Netzwerken anhand eines einfachen Beispiels werden dann noch verschiedene Analysemethoden und Visualisierungstechniken beleuchtet.

Page 5: Analyse sozialer Bindungen - Über Netzwerkdaten zu mehr Kundenwissen

Analyse sozialer Bindungen: Über Netzwerkdaten zu mehr Kundenwissen

© mayato® GmbH. Alle Rechte vorbehalten. Seite 3

2 Anwendung und Nutzen von Netzwerken

2.1 Kunden als MultiplikatorenDie Kenntnis von Netzwerken innerhalb des Privat-kundenbestandes kann vor allem im Marketing, aber auch in anderen Bereichen des Unternehmens genutzt werden. Manche Kunden sind sehr wichtig für das Unternehmen, und zwar nicht (nur), weil sie besonders viel zum Umsatz beitragen, sondern we-gen ihrer sozialen Kontakte zu anderen Kunden.

Im seinem Buch „The Tipping Point“ [1] unterschei-det Malcolm Gladwell drei Typen von Netzwerkteil-nehmern, die besonders wichtig bei der Verbrei-tung von Nachrichten sind:

› „Konnektoren“, die sehr viele Verbindungen zu anderen Individuen haben,

› „Experten“, die das Netzwerk mit neuen Informationen versorgen, und

› „Verkäufer“, die andere von einer Sache überzeugen können.

Speziell Konnektoren und Verkäufer fungieren dann als Multiplikatoren, um die gewünschte Botschaft weiter im Kundenbestand zu kommunizieren. Hat man diese Schlüsselfiguren in seinem Netzwerk identifiziert, so ist man in der Lage, mit relativ we-nig Aufwand einen großen Teil seiner Kunden zu erreichen.

Ein wichtiger Aspekt dabei ist, dass durch diese Form der Kommunikation die Information glaub-würdiger vermittelt wird, als dies durch Massen-kommunikation des Unternehmens jemals mög-lich wäre. Einem guten Bekannten oder Freund glaubt man im Normalfall eher als einem anonym bleibenden Unternehmen — selbst bei noch so per-sönlich gestalteter Werbung. Informationen, die durch das Netzwerk weitergege-ben werden, bleiben dem Informationsempfänger außerdem oft besser und länger im Gedächtnis, als dies z.B. bei einem Brief des Unternehmens der Fall wäre (falls der Brief überhaupt gelesen wird).

Im Umgang mit diesen Schlüsselfiguren im Netz-werk ist es besonders wichtig, im Voraus die Wir-kung einer Marketing-Maßnahme oder Kommuni-kation richtig einzuschätzen. Ein Negativ-Beispiel in diesem Zusammenhang ist ein großes Software-

Unternehmen, das bekannten Bloggern Laptops schenkte, auf denen die neueste Software des Unternehmens installiert war. Diese Aktion wurde in den angesprochenen Kreisen vielfach als Beste-chungsversuch ausgelegt, was in den einschlägigen Blogs und Foren auch prominent diskutiert wurde. Der Plan des Unternehmens, die Blogger als Multi-plikatoren einzusetzen, war damit zwar aufgegan-gen, jedoch war die multiplizierte Botschaft der beabsichtigten Botschaft genau entgegengesetzt.

Wie man es besser macht, zeigt ein klassisches Bei-spiel: Das Unternehmen Tupperware baut seinen Vertrieb fast ausschließlich auf Multiplikatoren auf. Kunden laden Freunde und Bekannte zu „Tupper-parties“ zu sich nach Hause ein. Dort werden von einem Tupperware-Mitarbeiter neue und bewähr-te Produkte vorgestellt, die direkt vor Ort bestellt werden können. Der Ausrichter der Party (der „Mul-tiplikator“) erhält - abhängig vom Gesamtumsatz der Party - einen Warengutschein von Tupperware.Der Gastgeber bekommt eine zusätzliche Prämie für jeden Gast, der seinerseits eine Party ausrich-tet. Durch dieses Anreizsystem werden systema-tisch über die Netzwerke zufriedener Kunden neue Kunden gewonnen.

Manchmal sollen besondere Angebote nicht im ge-samten Kundenbestand kommuniziert werden, son-dern nur selektiv in bestimmten Kundensegmenten. Ebenso kommt es vor, dass unterschiedliche Aus-gestaltungen eines Angebots in unterschiedlichen Kundensegmenten kommuniziert werden sollen. In beiden Fällen sind u.U. die Grenzen persönlicher Netzwerke zu beachten, da diese nicht in allen Fällen entlang der bisher verwendeten Segment-grenzen laufen. Ein für eine Zielgruppe bestimmtes Sonderangebot (z.B. besonders günstige Zinskon-ditionen) könnte unbeabsichtigt auch Personen außerhalb dieser Zielgruppe erreichen und so schlimmstenfalls den Profit in anderen Kundenseg-menten reduzieren.

Ist die Netzwerkstruktur des Kundenbestandes be-kannt, so kann und sollte darauf geachtet werden, dass die Mitglieder desselben Netzwerk-Clusters das gleiche Angebot erhalten bzw. dass, wenn ein Cluster-Mitglied das Angebot aus bestimmten Gründen nicht erhalten soll, auch die anderen Mit-glieder das Angebot nicht erhalten.

Page 6: Analyse sozialer Bindungen - Über Netzwerkdaten zu mehr Kundenwissen

Analyse sozialer Bindungen: Über Netzwerkdaten zu mehr Kundenwissen

Seite 4 © mayato® GmbH. Alle Rechte vorbehalten.

2.2 KundenwertFür den Kundenwert und seine Bestimmung spielt das Netzwerk der Kunden ebenfalls eine wichti-ge Rolle. Bei der Bestimmung des Kundenwertes kann man grob zwischen zwei Arten unterscheiden (siehe auch [2]):

› Direkte Beiträge entstehen aus der unmittel-baren Geschäftsbeziehung des Kunden mit dem Unternehmen. Dieses Ertragspotential berechnet sich aus den abgezinsten zukünftig erwarteten Deckungsbeiträgen des Kunden. Diese bein-halten – ausgehend vom derzeitigen Geschäfts-volumen – erwartete Preiserhöhungen sowie ggfs. eine Steigerung der Kauffrequenz oder des Kaufvolumens.

› Indirekte Beiträge entstehen durch Aktivitäten des Kunden, die sich nicht direkt als Deckungsbei-trag beziffern lassen, jedoch auf mittelbare Weise Wert für das Unternehmen schaffen. Beispiele für indirekte Beiträge umfassen das Informationspo-tenzial (Produktideen, Verbesserungsvorschläge, Beschwerden), das Kooperationspotenzial (bspw. können Kunden an der Produktentwicklung betei-ligt werden) und – im Zusammenhang mit Netz-werken besonders wichtig – das Weiterempfeh-lungspotenzial.

Das Weiterempfehlungspotenzial eines Kunden wird im Wesentlichen von zwei Einflussgrößen getrie-ben. Zum einen – dies ist die Grundvoraussetzung – muss der Kunde bereit sein, das Unternehmen weiterzuempfehlen. Dies setzt eine hohe Kunden-zufriedenheit bzw. –loyalität voraus. Zum zweiten aber ist das persönliche Netzwerk des Kunden und die Rolle, die er darin einnimmt, entscheidend für die Höhe seines Weiterempfehlungspotenzials. Je größer das Netzwerk, desto höher ist auch das Empfehlungspotenzial – vorausgesetzt, die Empfeh-lungsbereitschaft ist vorhanden.

Für den Kundenwert wird das Weiterempfehlungs-potenzial immer wichtiger, was Beispiele aus un-terschiedlichen Branchen belegen. Die comdirect bank AG etwa schreibt in ihrem Geschäftsbericht für 2007: „Immer bedeutender wird zudem die Empfehlungsbereitschaft unserer Kunden. Über das Programm ‚Kunden werben Kunden‘ haben wir im Jahr 2007 etwa doppelt so viele Neukunden gewon-nen wie im Vorjahr.“

Eine Studie der Eismann Tiefkühl-Heimservice GmbH zeigte, dass 100 zufriedene Kunden durchschnitt-lich 30 neue Kunden anwerben [3].

[Abbildung 1: Komponenten des Kundenwertes]

Page 7: Analyse sozialer Bindungen - Über Netzwerkdaten zu mehr Kundenwissen

Analyse sozialer Bindungen: Über Netzwerkdaten zu mehr Kundenwissen

© mayato® GmbH. Alle Rechte vorbehalten. Seite 5

Der Kundenwert ist die zentrale Steuerungsgröße des CRM – dessen umfassende und stimmige Be-rechnung ist somit von essenzieller Bedeutung, um die Kundenbeziehungen eines Unternehmens effi-zient lenken und gestalten zu können. Nur so kann eine sinnvolle Allokation der kundenbezogenen Marketingausgaben sichergestellt werden. Fehlein-schätzungen des Kundenwertes können die Marke-ting-Effizienz erheblich reduzieren.

Daher gilt es, den Kundenwert vollständig zu er-fassen. Wie oben gezeigt, ist das Weiterempfeh-lungspotenzial eine wichtige Komponente des Kun-denwerts und darf bei dessen Bestimmung nicht vernachlässigt werden. Der Analyse des Kunden-Netzwerkes kommt also auch für die Marketing-Steuerung eine wichtige Bedeutung zu.

2.3 RisikosteuerungSoziale Verbindungen und insbesondere Familien-verbünde sind geeignet, die Risikosteuerung in ei-nem Unternehmen zu verfeinern.

Offensichtlich ist, dass Dubletten im Privatkunden-bestand, also mehrere Kundenbeziehungen, hinter denen eine einzige Person steht, besonders aus Risikogesichtspunkten zusammengefasst und im ganzen gesehen werden müssen. Das Unterneh-men sollte immer das gesamte Kreditengagement einer Person betrachten. Dieses Konzept des Ge-samtengagements lässt sich erweitern auf Famili-enverbünde. Da Familien oft eine wirtschaftliche Einheit bilden, muss das Kreditengagement bzw. das daraus resultierende Risiko im Gesamten be-trachtet werden.

Familiäre oder andere Verbindungen können sowohl negative wie auch positive Einflüsse auf die erwar-tete Bonität eines Kunden haben. Wenn für einen Kunden in der Vergangenheit schon ein Mahnver-fahren oder sogar ein Zahlungsausfall zu verzeich-nen war, so wird eine Bank zögern, einem Famili-enangehörigen Kredit einzuräumen – sofern die Familienzugehörigkeit erkannt wird.

Auf der anderen Seite kann sich eine gute Kredithis-torie auch positiv auf Kreditentscheidungen von Familienangehörigen auswirken. Bei größeren Kre-diten würde man dies zwar mittels einer Bürgschaft vertraglich absichern, bei Kleinkrediten jedoch wäre die Berücksichtigung der Kredithistorie im Netzwerk des Kunden sicherlich eine kostengüns-tige Alternative.

Nicht nur Familienverbünde, sondern auch andere soziale Bindungen können die Bonität fördern und die Zahlungsmoral steigern. Dies zeigt ein Konzept aus der Dritten Welt, das derzeit auch in Industrie-nationen Fuß fasst: Microcredits. In der ursprüng-lichen Ausprägung handelt es sich dabei um Kre-dite etwa in der Größenordnung 100 bis 1.000€, die von einer Bank an Kleinstgewerbetreibende vergeben werden. Die Kreditnehmer sind sehr oft in Dorfgemeinschaften eingebunden; die Koordi-nation vor Ort übernimmt eine Person aus dem-selben Dorf, die auch die pünktliche Rückzahlung überwacht. Dieses enge soziale Netz bewirkt eine erhebliche Reduzierung des Risikos. Dieses Beispiel zeigt, dass soziale Bindungen nicht nur als Bonitäts-indikator geeignet sind, sondern sogar die Bonität steigern können.

2.4 Risikosteuerung im FirmenkundenbereichAbhängigkeiten zwischen Unternehmen können unterschiedliche Ursachen haben. Zum einen gibt es natürlich Kapitalbeteiligungen und Konzern-verflechtungen. Aber auch Kunden-Lieferanten-Beziehungen können zu Abhängigkeiten führen. Diese sind umso stärker, je weniger Kunden bzw. Lieferanten ein Unternehmen hat bzw. je größer der Umsatzanteil einzelner Kunden ist. Man denke z.B. an Zulieferer der Automobilindustrie, die oft nur einen Abnehmer für ihre Produkte haben.

Finanzielle Beziehungen und Abhängigkeiten zwi-schen Unternehmen führen zu Abhängigkeiten der Kreditrisiken. Ist beispielsweise der Erfolg von Unternehmen A von Unternehmen B ganz oder teilweise abhängig, so erhöht sich das Kreditaus-fallrisiko von A dramatisch, wenn B in wirtschaft-liche Schwierigkeiten gerät. Das wirtschaftliche Netzwerk eines Unternehmens ist also ein nicht zu unterschätzender Faktor bei der Bestimmung des Risikos.

Die Struktur des Netzwerks eines Unternehmens spielt eine große Rolle für die Anfälligkeit für ex-tern verursachte Risiken. Im Extremfall kann bei hochvernetzten Unternehmen das ganze Netzwerk zusammenbrechen, wenn nur ein Unternehmen in Schwierigkeiten gerät. Man spricht dabei auch von „credit contagion“, also der „Ansteckung“ von Krediten.

Page 8: Analyse sozialer Bindungen - Über Netzwerkdaten zu mehr Kundenwissen

Analyse sozialer Bindungen: Über Netzwerkdaten zu mehr Kundenwissen

Seite 6 © mayato® GmbH. Alle Rechte vorbehalten.

In diesem Zusammenhang sind auch Verflechtun-gen von Unternehmen und Privatpersonen erwäh-nenswert. Hat der Geschäftsführer eines mittel-ständischen Familienunternehmens privat ein Hypothekendarlehen bei der Hausbank seiner Firma, so sind die Ausfallrisiken der beiden Enga-gements hochgradig verknüpft. Dies gilt besonders für Personengesellschaften und deren persönlich haftende Gesellschafter. Auch solche Verbindun-gen sollten deshalb bei der Risikosteuerung be-trachtet werden.

Aus den genannten Gründen ist es wichtig, nicht nur das Netzwerk, in das ein Kunde eingebunden ist, zu identifizieren, sondern auch die Struktur des Netzwerks und die Rolle, die der Kunde darin spielt, zu analysieren. Wie später noch im Detail gezeigt wird, stehen dafür moderne Methoden zur Verfü-gung, die von der Visualisierung bis zur Ermittlung von Kenngrößen reichen.

Die Erfassung der Risiken, die aus der wirtschaftli-chen Verknüpfung von Unternehmen entstehen, ist für Banken nicht nur ein Gebot der Ökonomie, son-dern auch aufsichtsrechtlich verpflichtend. Derarti-ge Risiken stellen nach den von der Bundesanstalt für Finanzdienstleistungsaufsicht vorgegebenen „Mindestanforderungen an das Risikomanagement“ (MaRisk) Konzentrationsrisiken dar, die bei der Risi-koermittlung zu berücksichtigen sind.

2.5 Betrugserkennung und -bekämpfungDas Problem krimineller Handlungen von Kunden, aber auch von Mitarbeitern und Geschäftspartnern wird gerade in wirtschaftlich schwierigen Zeiten immer bedeutender [4]. Auch in diesem Bereich lassen sich über die Identifikation von Kundennetz-werken Risiken reduzieren.

Bei der Betrugserkennung (siehe Abb. 2) verlassen sich Unternehmen bisher häufig auf das Fachwis-sen und die Intuition erfahrener Mitarbeiter. Ein großer Teil des Aufwands entfällt dabei auf die passive Überprüfung von externen (z.B. Polizei/ Staatsanwaltschaften) oder internen (z.B. Inkas-soabteilung) Hinweisen auf Unregelmäßigkeiten.Die aktive, präventive Untersuchung kann nur für einen kleinen Teil der Verträge, z.B. für die beson-ders hochvolumigen Fälle, vorgenommen werden.

Deshalb ist eine automatisierte, computergestütz-te Betrugserkennung unabdingbar. Herkömmliche hypothesengetriebene Verfahren umfassen zum einen die regelmäßige Erstellung beschreibender Reports, die auf Auffälligkeiten untersucht werden. Zum anderen kann die Erfahrung der Betrugsexper-ten in Regeln übersetzt werden, aus denen dann Verdachtsfälle abgeleitet werden.

Betrugstypische Verhaltensmuster sind sehr kom-plex, deshalb sind Expertenregeln oft zu grob. Klas-sische Data-Mining-Techniken können diese komple-xen Muster aufdecken und sind sehr gut geeignet, potenzielle Betrugsfälle zu identifizieren. So kann maschinell eine große Anzahl von Fällen auf diese typischen Muster untersucht werden. Die auf diese Weise gefundenen Verdachtsfälle können dann ei-ner manuellen Prüfung durch Experten unterzogen werden.

Mit dieser Methode findet man allerdings nur den Teil der Betrugsfälle, bei denen sich der Betrüger „typisch“ verhält. Weitere Fälle, bei denen dies nicht zutrifft, können durch den Einsatz von SNA-Techniken aufgedeckt werden. Ausgehend von einem erkannten Betrugsfall kann man etwa das lokale Netzwerk des entlarvten Betrügers nach weiteren Auffälligkeiten durchsuchen. So wird der Suchraum erheblich eingeschränkt und die Chan-cen, bislang unentdeckte Fälle zu finden, steigen erheblich.

Neben der Untersuchung des Netzwerkes in einem konkreten Betrugsfall kann auch die Mustererken-nung in Netzwerken („Graph Mining“) zu wertvol-len Erkenntnissen führen. Im Gegensatz zum Data Mining werden hier nicht Muster im Verhalten von Kunden untersucht, sondern Muster in der Struktur des Netzwerkes bestimmter Kunden - nämlich der bekannten Betrüger.

Die Fragestellung ist also: Wie ist typischerweise ein Betrügernetzwerk strukturiert? Basis solcher Analysen sind also immer erkannte Betrugsfälle. Die identifizierten Muster können dann wiederum genutzt werden, um weitere kriminelle Handlun-gen schon frühzeitig zu erkennen und damit Scha-den zu vermeiden.

Page 9: Analyse sozialer Bindungen - Über Netzwerkdaten zu mehr Kundenwissen

Analyse sozialer Bindungen: Über Netzwerkdaten zu mehr Kundenwissen

© mayato® GmbH. Alle Rechte vorbehalten. Seite 7

[Abbildung 2: Methoden der Betrugserkennung]

2.6 Data MiningIn Vorhersagemodellen wird versucht, ein Ereignis (z.B. einen Kreditausfall) durch Informationen, die schon vor dem Eintritt des Ereignisses bekannt wa-ren, statistisch zu erklären. Das resultierende Data-Mining-Modell wird dann benutzt, um aufgrund der erklärenden Merkmale das Eintreten des modellier-ten Ereignisses für neue Fälle (z.B. noch laufende Kredite) zu prognostizieren.

In herkömmlichen Data-Mining-Modellen umfassen die erklärenden Merkmale demographische Infor-mationen (z.B. Alter, Geschlecht) sowie Merkmale, die aus dem Geschäftsverhältnis mit dem Kunden abgeleitet werden (z.B. Entwicklung des Kontosal-dos, Anzahl Kontotransaktionen, Anzahl Kunden-kontakte, Produktnutzung).

Die Position eines Kunden in seinem Netzwerk ist ein Spiegel seines (Kommunikations-) Verhaltens. Kundenkennzahlen und -merkmale, die aus dem Netzwerk abgeleitet werden, können also Infor-mationen enthalten, die in herkömmlichen Kun-denmerkmalen nicht enthalten sind und deshalb im Rahmen eines Data-Mining-Modells wertvolle Beiträge liefern. Einige Beispiele für solche netz-werkbasierten Merkmale werden in Kapitel 5 die-ses Whitepapers erläutert.

3 Analyse von Beziehungen zwischen Kunden

Um Informationen über Kundennetzwerke nutzen zu können, müssen diese Informationen zunächst datentechnisch erschlossen werden. In vielen Fäl-len liegen Daten über Kundenverbindungen schon vor oder können mit wenig Aufwand aus vorliegen-den Daten abgeleitet werden. In diesem Kapi-tel werden einige Möglichkeiten aufgezeigt, wie Verbindungsdaten erschlossen werden können. Eine Auflistung zusätzlicher Datenquellen für eini-ge weitere Branchen ist in Tabelle 4 (Anhang) zu finden.

3.1 Identische PersonenDie engste Form der Beziehung zwischen Kunden ist die Identität vermeintlich unterschiedlicher Per-sonen oder Organisationen. Die Ursachen für Dub-letten sind vielfältig, liegen aber praktisch immer in der unzureichenden Behandlung von Kundendaten in den erfassenden Prozessen. Viele Freitextfelder, aber auch mangelhafte Anweisungen für Sach-bearbeiter und das Fehlen eines Datenqualitäts-managements führen dazu, dass derselbe Kunde mehrfach erfasst wird, in der Regel mit leichten Abweichungen in Schreibweisen von Namen oder Adressen oder auch mit unterschiedlichen Kon-taktdaten (z.B. mit unterschiedlichen Emailadres-sen oder im Feld „Telefon“ mal mit der Festnetz-, mal mit der Mobilnummer).

Page 10: Analyse sozialer Bindungen - Über Netzwerkdaten zu mehr Kundenwissen

Analyse sozialer Bindungen: Über Netzwerkdaten zu mehr Kundenwissen

Seite 8 © mayato® GmbH. Alle Rechte vorbehalten.

Vorname Nachname PLZ Ort Straße Hausnummer

Johann Muster 13507 Berlin Marktstr. 35a

Johan Mutter 13507 Berlin Marktstraße 35a

[Tabelle 1: Dublette]

Gute CRM-Systeme helfen, solche Probleme schon bei der Eingabe zu erkennen und zu vermeiden. Na-mensänderungen (durch Heirat oder Scheidung), Umzüge, wechselnde Telefonanbieter oder Kon-tonummern oder andere reale Veränderungen auf Kundenseite können es aber auch solchen Syste-men schwer machen, die Identität eines vermeint-lichen Neukunden mit einem vorhandenen Eintrag im Kundenstamm zu erkennen.

Bei der Analyse von Kundenbeziehungen besteht daher in jedem Fall der erste Schritt darin, den Kundenbestand auf die Existenz von Dubletten zu überprüfen. Da Dubletten nicht immer offensicht-lich sind bzw. nicht immer durch einfachen String-Vergleich ermittelt werden können (siehe Tabelle 1), sollte eine spezialisierte Dublettenerkennungs-Software eingesetzt werden, die Identitäten auf Basis von Ähnlichkeiten bzw. phonetischer Identi-tät feststellt. Eine Liste mit Software-Anbietern für den Dublettenabgleich ist in Tabelle 5 im Anhang zu finden.

3.2 FamilienverbündeHat man Dubletten identifziert und ggf. eliminiert, so ist der denkbar engste soziale Kontakt derjenige mit den eigenen Haushalts- oder Familienangehöri-gen. In diesem Kreis ist die Kommunikationsdichte und das Vertrauen in die Richtigkeit der vermittel-ten Information im Allgemeinen sehr hoch. Gleich-zeitig sind Familienangehörige auch finanziell und rechtlich eng verbunden, was insbesondere bei Po-tential- und Risikoanalysen eine große Rolle spielen kann. Deshalb ist es für ein Unternehmen wichtig, Familien- und Haushaltsverbünde im Kundenbe-stand zu erkennen.

Zur Ermittlung von Familienverbünden kann als einfachster Ansatz ebenfalls Dublettenerkennungs-Software eingesetzt werden. Dabei führt man eine Dublettenprüfung auf Basis des Nachnamens und der Adresse durch. Die Grenzen dieses Ansatzes

sind schnell offensichtlich, wenn man sich die zu-nehmende Zahl von Sozialgemeinschaften ins Be-wusstsein ruft, die nicht der traditionellen Familie mit einem einheitlichen Namen entsprechen. We-der unverheiratet zusammenlebende noch ver-heiratete Personen mit unterschiedlichem Namen werden durch diesen Ansatz erkannt. Auch Kinder aus früheren Ehen oder anderen Partnerschaften tragen oft abweichende Nachnamen und lassen sich so nicht ohne weiteres den Familien zuordnen, in denen sie leben.

Das Beispiel in Tabelle 2 macht deutlich, was eine intelligente Dubletten-Software hier leisten muss: Johann und Monika sind verheiratet. Die Software muss die beiden auch als einer Familie zugehörig erkennen, da sie die gleiche Adresse und zumindest teilweise gleiche Nachnamen haben. Marie, die Tochter von Monika aus einer früheren Beziehung, muss über den zweiten Teil des Doppelnamens von Monika ebenfalls der Familie zugeordnet werden. Gibt Monika nur einen Teil ihres Nachnamens an, so ist eine vollständige Erkennung der Familie nicht möglich.

Ein weiteres Problem besteht darin, dass häufige Namen (z.B. Müller oder Schmidt) in großen Wohn-anlagen auch mehrfach vorkommen können, ohne dass eine familiäre Verbindung besteht. Auch er-wachsene Kinder, die nicht mehr im Haus der El-tern leben, oder Ehepartner, die aus beruflichen Gründen zwei verschiedene Wohnungen haben, können nicht korrekt zugeordnet werden. Durch Einbeziehen zusätzlicher Kontaktinformationen (z.B. Mobilnummer, Faxnummer, Emailadresse) oder Personendaten (z.B. Geburtsdatum, Geburts-ort) lassen sich nicht in allen Fällen die entgange-nen Verbindungen herausfinden.

Page 11: Analyse sozialer Bindungen - Über Netzwerkdaten zu mehr Kundenwissen

Analyse sozialer Bindungen: Über Netzwerkdaten zu mehr Kundenwissen

© mayato® GmbH. Alle Rechte vorbehalten. Seite 9

Vorname Nachname PLZ Ort Straße Hausnummer

Johann Muster 13507 Berlin Marktstr. 35a

Johan Mutter 13507 Berlin Marktstraße 35a

Monika Muster-Mann 13507 Berlin Marktstraße 35a

Marie Mann 13507 Berlin Marktstraße 35a

Franz Vogel 13507 Berlin Marktstr. 35a

Vorname Nachname PLZ Ort Straße Hausnummer

Johann Muster 13507 Berlin Marktstr. 35a

Johan Mutter 13507 Berlin Marktstraße 35a

Monika Muster-Mann 13507 Berlin Marktstraße 35a

Marie Mann 13507 Berlin Marktstraße 35a

[Tabelle 2: Familienverbund]

Banken haben glücklicherweise weitergehende Möglichkeiten, Familienverbünde zu erkennen:

› Minderjährigenkonten: Ist der Kontoinhaber minderjährig, so müssen die Eltern ihre Zustim-mung zur Kontoeröffnung geben. Oft sind die El-tern auch handlungsbevollmächtigt für das Min-derjährigenkonto. So hat die Bank einen sicheren Hinweis auf den Familienverbund.

› Freistellungsaufträge: Bei gemeinsamer steuer-licher Veranlagung von Ehepartnern kann ein gemeinsamer Auftrag zur Freistellung von der Abgeltungssteuer erteilt werden. Die beiden beteiligten Personen sind also mit Sicherheit verheiratet.

› Gemeinschaftskonten (Konten mit mehreren gleichberechtigten Inhabern): Häufig sind die In-haber Ehepartner oder familiär verbunden, z.B. Eltern und deren (volljährige) Kinder. Da dies je-doch nicht zwingend der Fall sein muss, kann hier ein Abgleich über Nachnamen bzw. über Nachna-men und Adresse Klarheit bringen.

› Gemeinsame Referenzkonten: Depots, Tages-geldkonten etc. benötigen in vielen Fällen ein Girokonto als Referenzkonto.

Ein gemeinsames Referenzkonto weist auf eine familiäre Verbindung hin. Auch aus dem Kun-denverhalten (d.h. einzelnen Transaktionen) und bestimmten vertraglichen Konstellationen (z.B. Bürgschaften) lassen sich Indizien für Familien-verbünde – wiederum natürlich auch andere Beziehungen – ableiten. Allerdings sei an dieser Stelle darauf hingewiesen, dass Analysen dieser Art in vielen Ländern einen Verstoß gegen gel-tendes Datenschutzrecht darstellen können. So darf beispielsweise zu werblichen Zwecken eine Bank in Deutschland keine Transaktionsdaten auswerten.

Ein weiteres Problem wird bei Hinzunahme sol-cher Arten von Informationen deutlich: Je mehr Faktoren in eine Analyse einbezogen werden sol-len, desto größer wird das Volumen an Daten und desto umfangreicher der Raum an möglichen Hy-pothesen für eine konfirmative Datenanalyse. In vielen Fällen wird man nicht mehr ohne explorati-ve Verfahren auskommen, die von sich aus in den vorhandenen Daten aktiv nach relevanten Mustern suchen und den Analysten auf interessante Kon-stellationen aufmerksam machen (Data Mining, Text Mining).

[Tabelle 3: Hausverbund]

[Tabelle 1: Dublette]

Page 12: Analyse sozialer Bindungen - Über Netzwerkdaten zu mehr Kundenwissen

Analyse sozialer Bindungen: Über Netzwerkdaten zu mehr Kundenwissen

Seite 10 © mayato® GmbH. Alle Rechte vorbehalten.

3.3 HausverbündeZumindest in Wohnhäusern, die höchstens von zwei bis drei Parteien bewohnt werden, kennen sich die Hausbewohner untereinander. Um die zunehmen-den Probleme bei der Ermittlung von Familienver-bünden zu umgehen, werden Kunden oft als sozi-al verbunden eingestuft, wenn sie im selben Haus wohnen. Dafür wird eine Dublettenprüfung auf Hausebene durchgeführt, in der nur auf Identität von postalischen Adressen geprüft wird. Zum Beispiel werden alle Kunden aus Tabelle 3 demselben Hausverbund zugeordnet und damit als „sozial verbunden“ eingestuft. Dieses Vorge-hen hat wiederum den Nachteil, dass u.U. Per-sonen zusammengefasst werden, die sich gar nicht kennen, z .B. in großen Mehr famil ien- häusern.

Als Mischform zwischen Familien- und Hausver-bund bietet sich an, die Dublettenprüfung auf Hausebene nur für Häuser mit (z.B.) höchstens vier Wohneinheiten durchzuführen und nur bei größe-ren Mehrfamilienhäusern auf Familienverbünde zu prüfen. Spezialisierte Dienstleister (siehe Tabelle 6 im Anhang) bieten die dafür notwendigen Daten (Anzahl Wohneinheiten pro Haus) an.

3.4 Freunde und BekannteEnde der 1960er Jahre untersuchte der Soziologe Mark Granovetter mittels einer Umfrage, wie Men-schen zu ihren jeweiligen Jobs kommen [5]. Er kam zu dem überraschenden Ergebnis, dass die entschei-denden Informationen nicht von engen Freunden, sondern von entfernten oder flüchtigen Bekannten kommen. Dieses Beispiel zeigt, wie wichtig es ist, nicht nur enge soziale Kontakte, sondern alle erkennbaren Verbindungen zu identifizieren.

Viele Unternehmen setzen zur Neukundengewin-nung Empfehlungsprogramme ein. Der im Rahmen eines solchen Programms geworbene Kunde und der werbende Kunde kennen sich offensichtlich.Hier ergibt sich ein neuer Aspekt, der in den bis-her behandelten Beziehungsarten nicht vorhanden war: die Beziehung ist nicht symmetrisch. Der Wer-ber hat Einfluss auf den Geworbenen, der Gewor-bene vertraut der Empfehlung des Werbers. Diese Asymmetrie lässt sich z.B. ausnutzen, indem der Werber gezielt als Multiplikator eingesetzt wird.

In der Praxis kommt es manchmal vor, dass Kun-denempfehlungsprogramme von findigen Personen nahezu gewerblich genutzt werden.

Diese „Berufswerber“ sollten identifiziert und die entsprechenden Beziehungen nicht für die Netz-werk-Erkennung berücksichtigt werden. Das glei-che gilt für die Werbung im Familienkreis. Hier zieht man nicht die Kundenwerbung, sondern die Familienbeziehung als Verbindung heran.

Unternehmenseigene Internet-Communities lassen sich ebenfalls als Informationsquelle für Kunden-Beziehungen nutzen. Beispielsweise betreiben gro-ße Online-Banken und Medienhäuser vielbesuchte Finanzseiten wie www.comdirect.de oder www.wallstreet-online.de, die auch eine Community bzw. Foren enthalten. Dort tauschen sich die Nutzer über Finanzthemen aus. Viele der Nutzer sind auch Kunden der entsprechenden Banken.

Foren-Threads können zur Ermittlung von Bezie-hungen genutzt werden. Alle Autoren innerhalb eines Threads könnten als „miteinander bekannt“ definiert werden. Voraussetzung für die Nutzung der daraus entstehenden Daten für die Erkennung von Bekanntschaften ist, dass sich datentechnisch der Community-User der Person im Kundenbestand zuordnen lässt. Diese Art der Bekanntschaft ist je-doch weitaus schwächer als die vorher genannten Arten, aber – wie oben erwähnt – deshalb nicht we-niger wichtig. Nicht wenige Firmen analysieren daher schon heute die firmeneigenen Blogs oder öffentliche Internetforen mit Hilfe automatisierter Verfahren wie Text Mining und können so nicht nur Aussagen über Multiplikatoren und deren Bezie-hungen treffen, sondern auch noch deren Relevanz ermitteln, also z.B. ob sich jemand kritisch oder lobend gegenüber einem bestimmten Produkt äußert.

Der Vollständigkeit halber seien an dieser Stelle auch noch spezielle Beziehungen erwähnt, die schon immer eine besondere Rolle im Marketing gespielt haben: Berühmtheiten und Prominente haben de-finitionsgemäß große Netzwerke. Viele Menschen kennen sie (auch wenn diese Bekanntschaftsbe-ziehungen in den meisten Fällen einseitig sind). Deshalb empfiehlt es sich für Unternehmen, diese Berühmtheiten – seien es bekannte Sportler und Künstler, oder auch lokale Größen wie der Ortsbür-germeister oder der Wirt des Vereinsheims – sys-tematisch zu erfassen, insbesondere wenn diese auch Kunden des Unternehmens sind.

Page 13: Analyse sozialer Bindungen - Über Netzwerkdaten zu mehr Kundenwissen

Analyse sozialer Bindungen: Über Netzwerkdaten zu mehr Kundenwissen

© mayato® GmbH. Alle Rechte vorbehalten. Seite 11

Anders als bei den bisher genannten Beziehungen sind diese Beziehungen in den meisten Fällen nur vermutet, und nur einer der beiden „Beziehungs-partner“ – nämlich der berühmte – ist dem Unter-nehmen bekannt.

3.5 EinschränkungenNur ein kleiner Teil der tatsächlich vorhandenen Bekanntschaftsbeziehungen können von Unterneh-men ermittelt und genutzt werden. Soziolo-gen schätzen, dass jeder Mensch zwischen 200 und 5.000 Bekannte hat.

Auch wenn man diese Bekanntschaften auf die für das Unternehmen relevanten Bekanntschaften reduziert, wird nur ein kleiner Teil erfasst werden können. Generell besteht das Problem, dass nur die positive Aussage „Die Kunden A und B kennen sich“ getroffen werden kann. Findet man in den Daten keine Hinweise auf eine Verbindung zwischen A und B, dann kann man sich nicht darauf verlassen, dass sich A und B nicht kennen. Es kann sein, dass sie sich kennen und dies aus den vorliegenden Da-ten nur nicht zu erkennen ist. Es darf also nur die positive Aussage genutzt werden; die Nutzung der negativen Aussage wäre ein Fehler.

Wie bei jeder Form der Kundendatenverarbeitung spielt das Thema Datenschutz auch hier eine Rol-le. Die datenschutzrechtliche Zulässigkeit sollte immer vor Nutzung des identifizierten Netzwerks geprüft werden. In jedem Fall sollte das Thema mit dem Datenschutzbeauftragten des Unter-nehmens besprochen und die grundsätzliche Nut-zung der Daten sowie die geplanten Analysen von diesem freigegeben werden.

4 Ein Datenmodell für Netzwerke

Kundennetzwerke können als mathematische Gra-phen verstanden werden. Jeder Kunde (Person) wird dabei als Punkt dargestellt. Besteht zwischen zwei Personen eine Beziehung, dann werden die jeweili-gen Punkte durch eine Linie verbunden.

Asymmetrische Beziehungen können durch Pfei-le gekennzeichnet werden. Im Fall von Kundenwer-bungen würde der Pfeil bspw. vom Werber zum Geworbenen zeigen. Die Stärke der Beziehung kann durch ein Liniengewicht angegeben werden. Je stärker die Beziehung, desto größer das Gewicht.

Bspw. könnten Beziehungen zwischen Ehepartnern (gemeinsamer Freistellungsauftrag) das Gewicht 10 erhalten, während für Forums-Bekanntschaften das Gewicht 1 vergeben wird.

Beispiel: In Abbildung 3 ist exemplarisch ein Kun-denbeziehungsgeflecht dargestellt. Asymmetrische Beziehungen sind durch Pfeile dargestellt, die Stär-ke einer Beziehung ist als Liniengewicht vermerkt. Es sind verschiedene Beziehungsarten zu sehen:

› Kunde 1 hat den Kunden 2 geworben. › Die Kunden 4 und 7 sowie die Kunden 12 und

13 sind verheiratet (hohes Liniengewicht). › Kunde 13 hat im Forum einen Beitrag

geschrieben; im selben Thread hat sich auch Kunde 10 beteiligt.

› Kunde 20 wirbt viele Kunden, die aber untereinander nicht bekannt sind.

Datentechnisch bietet sich eine Darstellung einer Linie als (geordnetes) Paar von Punkten an. Will man Liniengewichte einbeziehen, so werden diese als Attribut der Linie gespeichert. In einer relatio-nalen Datenbank hat man also eine Tabelle, die die Punkte (Kunden) enthält, und eine zweite Tabelle, die die Linien (Beziehungen) in Form von jeweils zwei Punkten enthält. Eine dritte Tabelle enthält alle möglichen Verbindungsarten; dazu wird das Kantengewicht gespeichert, das die Stärke der Ver-bindung widerspiegelt.

Beispiel: Kunde 4 ist mit dem Kunden 7 verbun-den. Diese Verbindung ist in der Linientabelle (Ab-bildung 5) in der zweiten Zeile (line_id=2) gespei-chert. Die linkType_id ist 1, was bedeutet, dass 4 und 7 Ehepartner sind, siehe Abbildung 6: Verbin-dungstyp-Tabelle. Dort ist auch zu sehen, dass das Gewicht für Ehe-Beziehungen 10 ist.

Page 14: Analyse sozialer Bindungen - Über Netzwerkdaten zu mehr Kundenwissen

Analyse sozialer Bindungen: Über Netzwerkdaten zu mehr Kundenwissen

Seite 12 © mayato® GmbH. Alle Rechte vorbehalten.

[Abbildung 3: Kundennetzwerk]

point_id grad cl_points1 1 2

2 1 2

3 0 1

4 1 2

5 0 1

4 0 1

7 1 2

8 0 1

9 0 1

10 1 4

11 0 1

12 2 4

13 3 4

14 2 4

15 1 6

16 1 6

17 1 6

18 1 6

19 1 6

20 5 6

21 0 1

[Abbildung 4: Punktetabelle]

line_id point1 point2 linkType_id1 1 2 3

2 4 7 1

3 10 13 4

4 12 13 1

5 12 14 6

4 13 14 6

7 15 20 3

8 16 20 3

9 17 20 3

10 18 20 3

11 19 20 3

[Abbildung 5: Linientabelle]

linkType_id source_desc weight1 Ehepartner 10

2 Familie 6

3 Kundenwerbung 4

4 Online 1

[Abbildung 6: Verbindungstyp-Tabelle]

Page 15: Analyse sozialer Bindungen - Über Netzwerkdaten zu mehr Kundenwissen

Analyse sozialer Bindungen: Über Netzwerkdaten zu mehr Kundenwissen

© mayato® GmbH. Alle Rechte vorbehalten. Seite 13

5 Visualisierung und Kennzahlen

Für die Anwendung der Netzwerkanalyse lassen sich drei Hauptrichtungen erkennen (siehe dazu auch [6]):

› Die Analyse des Teilnetzwerkes eines Teilneh-mers. Hier sind speziell Visualisierungstechniken gefragt, die dem Analysten schnell eine gute Übersicht über die Netzwerkstruktur gibt.

› Die Berechnung von Kennzahlen und Merkmalen für jeden Netzwerkteilnehmer. Wichtig sind hier effiziente Berechnungsmethoden, da Netzwerke sehr groß sein können.

› Die Bewertung der Interaktionsmöglichkeiten der Netzwerteilnehmern. Im Fokus stehen hier die Auswirkungen der Änderung von Eigenschaf-ten eines Teilnehmers auf mit diesem verbunde-ne Teilnehmer.

5.1 Kennzahlen und Merkmale von NetzwerkteilnehmernNach dem Aufbau der im vorhergehenden Kapitel beschriebenen Netzwerk-Datenstruktur können je-dem Kunden Kennzahlen zugewiesen werden, mit deren Hilfe seine Rolle im Netzwerk charakterisiert wird. Die wichtigste Kategorie von Kennzahlen bil-den die Zentralitätskennzahlen. Diese sind Maße dafür, wie „wichtig“ einzelne Kunden im Netzwerk sind, sei es durch die Anzahl ihrer Verbindungen oder durch ihre strategische Rolle.

Das einfachste Zentralitätsmaß ist die Kontaktan-zahl. Sie gibt an, zu wie vielen anderen Kunden eine direkte Beziehung besteht. In Abbildung 3 ist die Kontaktanzahl als erste der beiden Kennzahlen bei den Punkten dargestellt.

Ist die Stärke der Verbindungen bekannt (Linien-gewichte), so kann man, anstatt die Beziehungen zu zählen, die Summe der Liniengewichte bilden. Eine einfache Abwandlung der Kontaktanzahl misst nich nur direkte Kontakte, sondern zählt auch die Kontakte der Kontakte mit (Kontakte zweiten Grades).

Zu den Zentralitätsmaßen gehört weiterhin die „Betweenness“, ein Maß für die Bedeutung eines Kunden für die Weitergabe von Nachrichten. Um die Betweenness eines Kunden zu berechnen, wird ermittelt, an wie vielen Kommunikationswegen der betrachtete Kunde beteiligt ist - in Relation zu al-len Kommunikationswegen.

Eine Komponente ist eine Menge von durch Be-kanntschaft verbundener Kunden. Dabei zählen nicht nur direkte Bekanntschaften, sondern auch Beziehungen über mehrere Stationen. Die Größe einer Komponente – als Kennzahl eines Kunden – ist also die Anzahl der anderen Kunden, mit de-nen er direkt oder indirekt verbunden ist (plus 1 für den Kunden selbst). Die Komponentengröße ist in Abb. 3 als zweite Kennzahl bei jedem Punkt angegeben.

Beispiel: Im Netzwerk aus Abbildung 3 ist Kunde 13 direkt mit 3 anderen Kunden verbunden. Keiner dieser drei Kunden hat weitere Kontakte, so dass das Netzwerk, dem Kunde 13 angehört, aus vier Kunden besteht. Die Clustergröße des Kunden13 ist damit 4. Ist bei einem Kunden die Kontaktan-zahl um 1 kleiner als die Clustergröße, dann kennt dieser alle Kunden in seinem Netzwerk. Dies ist z.B. für die Kunden 12 und 14 nicht der Fall, sie sind mit Kunde 10 nur indirekt über den Kunden 13 verbunden.

Netzwerkteilnehmer mit einer Schnittstellenfunkti-on spielen in Netzwerken eine wichtige Rolle. Man sagt, ein Teilnehmer fungiert als Schnittstelle, wenn die Komponente des Teilnehmers ohne ihn in meh-rere Teile zerfallen würde. Im Beispiel in Abbildung 7 fungieren die Kunden 4 und 5 als Schnittstellen.

[Abbildung 7: Schnittstelle]

Page 16: Analyse sozialer Bindungen - Über Netzwerkdaten zu mehr Kundenwissen

Analyse sozialer Bindungen: Über Netzwerkdaten zu mehr Kundenwissen

Seite 14 © mayato® GmbH. Alle Rechte vorbehalten.

[Abbildung 8: Rollen in Netzwerken]

Manche Netzwerke sind zwar zusammenhängend, d.h. jeder ist mit jedem durch eine Kette von Ver-bindungen verknüpft, es lassen sich aber dennoch Cluster identifizieren. Ein Cluster in diesem Sinne ist eine Gruppe von Punkten, die untereinander stark verbunden sind, die aber nur wenige Verbin-dungen nach „außen“ hat.

Bezüglich dieser Cluster haben einzelne Punkte (Kunden) Rollen, die nun kurz beschrieben werden (Abb. 8):

› Soziale Punkte haben viele Kontakte sowohl in-nerhalb als auch außerhalb ihres Clusters.

Sie sind wichtig für den Zusammenhalt des ge-samten Netzwerks

› Clusterpunkte haben viele Kontakte innerhalb ihres Clusters, aber nur wenige oder gar keine au-ßerhalb. Sie sind bedeutend für den Zusammen-halt ihres Clusters.

› Schnittstellenpunkte haben relativ viele Kontakte außerhalb ihres Clusters, aber relativ wenige in-nerhalb. Sie sind wichtig für die Kommunikation zwischen den Clustern.

› Autistenpunkte haben überhaupt wenig Kontakte.

Page 17: Analyse sozialer Bindungen - Über Netzwerkdaten zu mehr Kundenwissen

Analyse sozialer Bindungen: Über Netzwerkdaten zu mehr Kundenwissen

© mayato® GmbH. Alle Rechte vorbehalten. Seite 15

5.2 Visualisierung von NetzwerkenDie graphische Darstellung von Netzwerken kann ein gutes Hilfsmittel sein, um seine Struktur zu ver-stehen. Das menschliche Auge ist daran gewöhnt, Muster zu erkennen und graphische Zusammen-hänge zu erfassen. Allerdings sind ihm auch enge Grenzen gesetzt: Ab einer gewissen Größe wird jede Netzwerk-Darstellung so unübersichtlich, dass damit kein Erkenntnisgewinn mehr möglich ist.Sehr dichte Netzwerke, bei denen fast alle Punk-te durch Linien verbunden sind, eignen sich nicht für die Visualisierung.

Auch gilt es, bei der Darstellung bestimmte Regeln einzuhalten: Das menschliche Auge lässt sich auch leicht täuschen, wie jeder weiß, der schon einmal mit einem optischen Trick hereingelegt wurde. Re-geln für das Zeichnen von Netzwerken sind z.B:

› Die Entfernung zwischen zwei Punkten sollte die Stärke der Beziehung der beiden Punkte ausdrü-cken. Je stärker die Beziehung, desto näher liegen die Punkte beieinander.

› Punkte sollten nicht auf der Linie zwischen zwei anderen Punkten liegen.

› Linien sollten sich so selten wie möglich überschneiden.

Nicht immer lassen sich diese Richtlinien befolgen, man sollte aber darauf achten, dass sie möglichst selten verletzt werden.

In Softwarepaketen zur Analyse sozialer Netzwerke sind verschiedene Algorithmen zur automatischen Anordnung der Netzwerk-Punkte in der Ebene oder im dreidimensionalen Raum implementiert. Diese Algorithmen führen normalerweise nicht sofort zu einem zufriedenstellenden Ergebnis, mit etwas ma-nueller Nacharbeit können jedoch oft sehr schnell brauchbare Graphiken erzeugt werden.

Manchmal ist die zeitliche Entstehung von Netz-werken noch interessanter als die Struktur des aktuellen Netzwerks. Beispielsweise ist bei der Be-trugserkennung die Entstehungsgeschichte eines Betrügerrings von Bedeutung. Auch dafür gibt es Visualisierungstechniken. Voraussetzung dafür ist allerdings, dass für die einzelnen Punkte und Linien Zeitstempel vorhanden sind, d.h. die Information, wann ein Punkt oder eine Verbindung zum Netz-werk hinzugefügt wurde.

Ist dies der Fall, so kann man den Aufbau des Net-zes quasi als Film darstellen.

6 Fazit

Die Kenntnis sozialer Beziehungen gibt Unterneh-men die Möglichkeit, mehr über ihre Kunden zu er-fahren. Neben den klassischen im Data Warehouse gespeicherten Kundenmerkmalen wie Demographie oder Kauf- und Beziehungshistorie ergibt die Analy-se dieser Netzwerke eine neue Art von Kundenwis-sen. Dieses zusätzliche Wissen kann in Marketing und CRM wichtige, bisher noch nicht bekannte In-formationen liefern und so u.a. die Ressourcenallo-kation verbessern. Im Risikomanagement und bei der Betrugsbekämpfung wird die Berücksichtigung von Beziehungsdaten im Privat- sowie auch im Firmenkundengeschäft bald unumgänglich sein.

Für die Ermittlung sozialer Beziehungen gibt es zahlreiche Datenquellen. Ein generell einsetzbares Verfahren ist die Dublettenprüfung auf Personen-, Haushalts- und Hausebene. Weitere Datenquellen sind je nach Branche mehr oder weniger zahlreich vorhanden, erfordern aber umfangreichere und komplexere Analysen bis hin zu Data Mining oder Text Mining.

Die Entwicklung leistungsfähiger Tools für die Ana-lyse sozialer Netzwerke schreitet schnell voran. Der Data-Mining-Spezialist KXEN stellte 2009 das Mo-dul KSN für die Generierung von Netzwerk-Kenn-zahlen vor. Der weltweit führende Anbieter für Datenanalyse-Software SAS Institute stellte bei der letztjährigen Konferenz „SAS Forum Deutschland 2009“ eine SNA-Komponente vor, die im Rahmen des SAS Fraud Framework verfügbar sein wird. Weitere Lösungen für Marketing und CRM sind für 2010 angekündigt.

Ausgehend von Web2.0-Anwendungen und der Telekommunikationswirtschaft hat sich eine neue Analyserichtung entwickelt, der sich moder-ne Unternehmen unterschiedlichster Branchen in Zukunft nicht verschließen dürfen. Trotz einiger Schwierigkeiten bei der Umsetzung des Konzepts – beispielsweise müssen Datenschutzaspekte im Einzelfall intensiv geprüft werden – wird sich die Nutzung vorhandener Kunden-Netzwerke in vielen Fällen auszahlen.

Page 18: Analyse sozialer Bindungen - Über Netzwerkdaten zu mehr Kundenwissen

Analyse sozialer Bindungen: Über Netzwerkdaten zu mehr Kundenwissen

Seite 16 © mayato® GmbH. Alle Rechte vorbehalten.

7 Anhang

[Tabelle 4: Möglichkeiten der Netzwerkidentifikation in verschiedenen Branchen]

Telekommunikation

› Telefonverbindungen: Wer ruft wen an? Wie oft? Wie lange?› SMS- und MMS-Verbindungen› Familien-/Freunde-Tarife› Firmentarife: Mitarbeiter kleinerer Firmen kennen sich› Rechnung/Kontonummer: Personen, deren Rechnungsbetrag vom selben Konto abgebucht wird, kennen sich› Gutscheine/Guthabenübertragung› Kundenwerbung

Zeitungs- und Zeitschriften-verlage

› Leser werben Leser› Kontonummer/Rechnung: siehe „Telekommunikation“› Geschenkabonnement› Blogs und Foren

Pharma

› Gemeinschaftspraxen, Apothekenverbände, Hausarztnetzwerke

› Ärztehäuser: Dublettenabgleich Hausebene› Teilnahme an der selben Pharmakologischen Studie› Häufige Überweisung an denselbe Facharzt› Gemeinsame Mitgliedschaft in Organisationen z.B. Ethikkommissionen, Selbsthilfegruppen› Gemeinsame Teilnahme an Konferenzen, Fortbildungen, › Prüfarzttreffen

Reiseveranstalter› Vergleich Ziel- und Heimadresse› Mietwagen/Zweitfahrer

Fluglinien

› Check-In-Informationen (Gemeinsamer Check-In)› Mehrmals benachbarte Sitzplätze › Flug von der selben Firma gebucht› Übertragung von Bonuspunkten› Kontonummer/Rechnung: siehe „Telekommunikation“

Energieversorger (Strom/Gas)› Kundenwerbung› Dublettenabgleich: zusätzlich Wohnungsnummer bekannt› Kontonummer/Rechnung: siehe „Telekommunikation“

Versand-/Internethandel

› Gemeinschaftsbesteller› Kontonummer/Rechnung: siehe „Telekommunikation“› Geschenkgutscheine› Wunschlisten› Kundenwerbung

Page 19: Analyse sozialer Bindungen - Über Netzwerkdaten zu mehr Kundenwissen

Analyse sozialer Bindungen: Über Netzwerkdaten zu mehr Kundenwissen

© mayato® GmbH. Alle Rechte vorbehalten. Seite 17

[Tabelle 5: Anbieter von Dublettenabgleichs-Software]

Anbieter Web Bemerkung

AZ Direkt GmbH www.az-direct.comAZ Direkt ist Spezialist für Zielgruppenadressen und bietet eine eigene Dublettenerkennungs-Software an.

Human Inferencewww.humaninfe-

rence.comHuman Inference bietet Software zur Optimierung der Datenqualität

Nobody Softwarewww.nobody-software.de

Das Produkt ist sehr preisgünstig und somit auch für kleinere und mittelständische Unternehmen interessant.

Omikron Data Quality GmbH

www.omikron.netOmikron ist Spezialist für Dublettenerkennungs-Software.

SAP AG www.sap.comDie Technologie der ehemaligen fuzzy! Informatik wurde in die BusinessObjects Lösungen integriert.

SAS DataFlux www.dataflux.comDataFlux gehört zum SAS Konzern und bietet eine Reihe von Lösungen rund um Datenqualität und Data Governance

Harte-Hanks Trillium Software

www.trilliumsoft-ware.com

Trillium Software ist ein globaler Anbieter von Daten-qualitäts- und Geocodierungs-Software

Uniserv GmbH www.uniserv.comUniserv war in Deutschland der erste Anbieter von Dublettenerkennungs-Software. Die Produkte sind für viele Plattformen (u.a. Windows, UNIX) erhältlich.

Page 20: Analyse sozialer Bindungen - Über Netzwerkdaten zu mehr Kundenwissen

Analyse sozialer Bindungen: Über Netzwerkdaten zu mehr Kundenwissen

Seite 18 © mayato® GmbH. Alle Rechte vorbehalten.

[Tabelle 6: Anbieter mikrogeographischer Daten für Deutschland]

Anbieter Web Bemerkung

Acxiom Deutsch-land GmbH

www.acxiom.deAcxiom ist Spezialist für raumbezogene und mikrogeogra-phische Daten sowie mikrogeographische Raumsegmen-tierungen.

AZ Direct GmbH www.az-direkt.comAZ Direct ist Spezialist für Zielgruppenadressen und bietet auch raumbezogene und mikrogeographische Daten an.

Deutsche Post Direkt GmbH

www.postdirekt.deDie Tochtergesellschaft der Deutschen Post ist primär im Adressmanagement tätig, hat aber auch mikrogeographi-sche Daten im Portfolio.

GfK Geomarketing GmbH

www.gfk-geomarke-ting.de

Die Tochter des global tätigen Marktforschungskon-zerns GfK Group vertreibt neben ihrer Kartographie-Software auch mikrogeographische Daten.

infas GEOdaten GmbH

www.infas-geodaten.de

infas GEOdaten war einer der ersten Anbierter für mikrogeographische Daten und gehört zur Schober Information Group.

microm GmbHwww.microm-online.

deDie microm GmbH ist Dienstleister für Zielgruppen-, Dialog- und Geomarketing

8 Literatur

[1] Malcolm Gladwell: The Tipping Point. ISBN 9780316679077

[2] Peter Neckel, Bernd Knobloch: Customer Relationship Analytics. ISBN 9783898643092

[3] Link/Brändli/Schleuning/Kehl (Hrsg.): Handbuch Database Marketing, S. 143-157.

ISBN 9783930047215

[4] Christopher Westphal: Data Mining for Intelligence, Fraud & Criminal Detection:

Advanced Analytics & Information Sharing Technologies. ISBN 9781420067231

[5] Mark Granovetter: The Strength of Weak Ties, American Journal of Sociology 78, S. 1360-1380

[6] De Nooy/Mrvar/Batagelj: Exploratory Social Network Analysis with Pajek. ISBN 9780521602624

Page 21: Analyse sozialer Bindungen - Über Netzwerkdaten zu mehr Kundenwissen

Analyse sozialer Bindungen: Über Netzwerkdaten zu mehr Kundenwissen

© mayato® GmbH. Alle Rechte vorbehalten. Seite 19

9 Über den Autor

Peter Gerngross ist Unternehmensberater und Experte für explorative Datenanalyse, Business Intelligence und Analytisches CRM bei mayato. Er beschäftigt sich seit vielen Jahren in zahlreichen Projekten mit kom-plexen Data-Mining-Analysen und deren effizienter Nutzung in der Praxis, insbesondere im Banken- und Versicherungsumfeld. Seine Spezialgebiete sind die Entwicklung und der Einsatz von Scoringmodellen, technologisches Betrugsmanagement sowie die Analyse sozialer Netzwerke.

10 Über mayato

Das BI-Analysten- und Beratungshaus mayato wurde im April 2007 mit der Vision der „perfekten Entschei-dung“ gegründet. mayato deckt in drei Bereichen das Thema Business Intelligence komplett ab: „Think“ untersucht aktuelle Trends, Märkte, Methoden, Produkte und Technologien. In „Act“ werden integrierte und flexible Infrastrukturen für Business Analytics konzipiert und realisiert. Darüber hinaus unterstützen im Bereich „Analyze“ Statistik- und Data-Mining-Experten Unternehmen in allen Bereichen der intelli-genten Datenanalyse. Die Spezialgebiete der mayato-Berater umfassen Risiko- und Betrugsmanagement, CRM Analytics und die Analyse sozialer Netzwerke in Kundenbeständen. Als Partner mehrerer Softwareanbieter ist mayato grundsätzlich der Neutralität und in erster Linie der Qualität seiner eigenen Dienstleistungen verpflichtet. mayato berät vom Hauptsitz in Berlin sowie wei-teren Standorten nationale und internationale Kunden vom Mittelständler bis zum Weltkonzern. Nähere Informationen unter www.mayato.com.

Kontakt: Ansprechpartner:

mayato GmbH Georg Heeren

Am Borsigturm 9 Tel. +49 30 4147.1667

D-13507 Berlin [email protected]

www.mayato.com

Page 22: Analyse sozialer Bindungen - Über Netzwerkdaten zu mehr Kundenwissen

Analyse sozialer Bindungen: Über Netzwerkdaten zu mehr Kundenwissen

Seite 20 © mayato® GmbH. Alle Rechte vorbehalten.mayato® GmbH | Am Borsigturm 9 | 13507 Berlin | T +49 30 4174.8657 | [email protected] | www.mayato.com