Bibliotheken im Spannungsfeld zwischen Nutzungsmessung und Datenschutz

26
Die ZBW ist Mitglied der Leibniz- Gemeinschaft Bibliotheken im Spannungsfeld zwischen Nutzungsmessung und Datenschutz Jan Lüth, Dr. Timo Borst IT-Entwicklung ZBW - Deutsche Zentralbibliothek für Wirtschaftswissenschaften Leibniz- Informationszentrum Wirtschaft 100. DEUTSCHER BIBLIOTHEKARTAG Berlin, 08.06.2011

Transcript of Bibliotheken im Spannungsfeld zwischen Nutzungsmessung und Datenschutz

Page 1: Bibliotheken im Spannungsfeld zwischen Nutzungsmessung und Datenschutz

Die ZBW ist Mitglied der Leibniz-Gemeinschaft

Bibliotheken im Spannungsfeld zwischen Nutzungsmessung und Datenschutz

Jan Lüth, Dr. Timo Borst

IT-Entwicklung

ZBW - Deutsche Zentralbibliothek für Wirtschaftswissenschaften

Leibniz-Informationszentrum Wirtschaft

100. DEUTSCHER BIBLIOTHEKARTAG

Berlin, 08.06.2011

Page 2: Bibliotheken im Spannungsfeld zwischen Nutzungsmessung und Datenschutz

Seite 2

Nutzungsmessung im WWW - Webanalytics Warum wollen Sie messen? Was wollen Sie messen? Wie wollen Sie messen? Rechtliche Grenzen / Datenschutz Welche Konsequenzen wollen Sie ziehen?

Page 3: Bibliotheken im Spannungsfeld zwischen Nutzungsmessung und Datenschutz

Seite 3

Nutzungsmessung im WWW - Webanalytics Was wollen Sie messen?

Traffic Metriken Erfolgs Metriken

Page 4: Bibliotheken im Spannungsfeld zwischen Nutzungsmessung und Datenschutz

Seite 4

Traffic Metriken

Page 5: Bibliotheken im Spannungsfeld zwischen Nutzungsmessung und Datenschutz

Clickmap

Page 6: Bibliotheken im Spannungsfeld zwischen Nutzungsmessung und Datenschutz

Heatmap

Page 7: Bibliotheken im Spannungsfeld zwischen Nutzungsmessung und Datenschutz

Seite 7

Pfadanalyse - Einstiegsseiten

Grafik: etracker

Page 8: Bibliotheken im Spannungsfeld zwischen Nutzungsmessung und Datenschutz

Seite 8

Pfadanalyse - Ausstiegsseiten

Grafik: etracker

Page 9: Bibliotheken im Spannungsfeld zwischen Nutzungsmessung und Datenschutz

Seite 9

Pfadanalyse - Klickpfade

Grafik: etracker

Page 10: Bibliotheken im Spannungsfeld zwischen Nutzungsmessung und Datenschutz

Seite 10

Trichteranalyse / Erreichen von Zielen Wie viele Nutzerinnen erreichen den jeweiligen und nachfolgenden

Schritt

Ziel (Konversion): Ausleihe / Dokumentlieferung / Download

Page 11: Bibliotheken im Spannungsfeld zwischen Nutzungsmessung und Datenschutz

Seite 11

Wie wollen Sie messen?

Application-Logfiles Webserver-Logfiles Pixelbasiertes Tracking Datenbank-Logs Netzwerkverkehr Download-Scripte

Page 12: Bibliotheken im Spannungsfeld zwischen Nutzungsmessung und Datenschutz

Seite 12

Webserver-Logfiles 192.168.1.111 - - [31/May/2011:15:10:01 +0200] "GET /index.php?id=search HTTP/1.1" 200 4392 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1„

192.168.1.111 - - [31/May/2011:15:10:01 +0200] "GET /typo3temp/stylesheet_bf871ed27f.css?1282651429 HTTP/1.1" 200 11727 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"

192.168.1.111 - - [31/May/2011:15:10:01 +0200] "GET /fileadmin/templates/screen/german_icons.css?1282651428 HTTP/1.1" 200 220 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"

192.168.1.111 - - [31/May/2011:15:10:01 +0200] "GET /typo3temp/javascript_0b12553063.js?1282651429 HTTP/1.1" 200 951 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"

192.168.1.111 - - [31/May/2011:15:10:01 +0200] "GET /fileadmin/templates/screen/my_layout.css HTTP/1.1" 200 9284 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"

192.168.1.111 - - [31/May/2011:15:10:01 +0200] "GET /fileadmin/templates/screen/patch_teaser.css HTTP/1.1" 200 201 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"

192.168.1.111 - - [31/May/2011:15:10:01 +0200] "GET /fileadmin/scripts/cookies.js HTTP/1.1" 200 5758 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"

192.168.1.111 - - [31/May/2011:15:10:01 +0200] "GET /fileadmin/scripts/efa_fontsize.js HTTP/1.1" 200 10800 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"

192.168.1.111 - - [31/May/2011:15:10:01 +0200] "GET /fileadmin/templates/screen/suchergebnisse.css HTTP/1.1" 200 10116 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"

192.168.1.111 - - [31/May/2011:15:10:01 +0200] "GET /images/zew.png HTTP/1.1" 200 1416 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"

192.168.1.111 - - [31/May/2011:15:10:01 +0200] "GET /fileadmin/yaml/core/base.css HTTP/1.1" 200 7838 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"

192.168.1.111 - - [31/May/2011:15:10:01 +0200] "GET /fileadmin/templates/screen/basemod.css HTTP/1.1" 200 2086 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"

192.168.1.111 - - [31/May/2011:15:10:01 +0200] "GET /fileadmin/yaml/navigation/nav_shinybuttons.css HTTP/1.1" 200 2905 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"

192.168.1.111 - - [31/May/2011:15:10:01 +0200] "GET /fileadmin/yaml/print/print_draft.css HTTP/1.1" 200 4629 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"

192.168.1.111 - - [31/May/2011:15:10:01 +0200] "GET /fileadmin/templates/screen/form.css HTTP/1.1" 200 6376 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"

192.168.1.111 - - [31/May/2011:15:10:01 +0200] "GET /fileadmin/yaml/core/print_base.css HTTP/1.1" 200 3520 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"

192.168.1.111 - - [31/May/2011:15:10:02 +0200] "GET /images/icons/zoomOut.gif HTTP/1.1" 200 919 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"

192.168.1.111 - - [31/May/2011:15:10:02 +0200] "GET /images/icons/normal.gif HTTP/1.1" 200 902 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"

192.168.1.111 - - [31/May/2011:15:10:02 +0200] "GET /images/icons/zoomIn.gif HTTP/1.1" 200 879 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"

192.168.1.111 - - [31/May/2011:15:10:02 +0200] "GET /fileadmin/images/bordertopnav.gif HTTP/1.1" 200 45 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"

192.168.1.111 - - [31/May/2011:15:10:02 +0200] "GET /fileadmin/images/flags/en.gif HTTP/1.1" 200 163 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"

192.168.1.111 - - [31/May/2011:15:10:02 +0200] "GET /fileadmin/images/econbiz_logo.gif HTTP/1.1" 200 4192 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"

192.168.1.111 - - [31/May/2011:15:10:02 +0200] "GET /fileadmin/images/personal_border.gif HTTP/1.1" 200 54 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"

192.168.1.111 - - [31/May/2011:15:10:02 +0200] "GET /images/btn_suche.png HTTP/1.1" 200 1278 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"

192.168.1.111 - - [31/May/2011:15:10:02 +0200] "GET /images/unikoeln.png HTTP/1.1" 200 2736 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"

192.168.1.111 - - [31/May/2011:15:10:02 +0200] "GET /images/zbw.png HTTP/1.1" 200 2214 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"

192.168.1.111 - - [31/May/2011:15:10:02 +0200] "GET /images/dfg.png HTTP/1.1" 200 554 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"

192.168.1.111 - - [31/May/2011:15:10:02 +0200] "GET /fileadmin/images/body_border.gif HTTP/1.1" 200 56 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"

192.168.1.111 - - [31/May/2011:15:10:02 +0200] "GET /fileadmin/images/nav_r_border.png HTTP/1.1" 200 220 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"

192.168.1.111 - - [31/May/2011:15:10:02 +0200] "GET /fileadmin/images/nav_no.png HTTP/1.1" 200 147 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"

192.168.1.111 - - [31/May/2011:15:10:02 +0200] "GET /fileadmin/images/nav.png HTTP/1.1" 200 182 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"

192.168.1.111 - - [31/May/2011:15:10:02 +0200] "GET /fileadmin/images/bg_nav.png HTTP/1.1" 200 13567 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"

192.168.1.111 - - [31/May/2011:15:10:02 +0200] "GET /fileadmin/images/nav_ac.png HTTP/1.1" 200 115 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"

192.168.1.111 - - [31/May/2011:15:10:02 +0200] "GET /fileadmin/images/footer_bk.png HTTP/1.1" 200 205 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"

192.168.1.111 - - [31/May/2011:15:10:02 +0200] "GET /fileadmin/images/dot_border.gif HTTP/1.1" 200 48 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"

35 Zeilen: Hits beim Aufruf einer Seite (pageview)

Page 13: Bibliotheken im Spannungsfeld zwischen Nutzungsmessung und Datenschutz

Webserver-Logfiles

Contra-ArgumentePro-Argumente

+ Automatisch verfügbar+ Auswertung / kostenlose Tools+ Protokollierung von Robots+ Protokollierung von

Fehlerseiten

- Nutzererkennung über IP-

Adresse nicht eindeutig- Robots müssen gefiltert werden- Eingeschränkte Detailanalyse

Webserver Logfiles sind primär Grundlage für Traffic-Metriken

Page 14: Bibliotheken im Spannungsfeld zwischen Nutzungsmessung und Datenschutz

Seite 14

Pixelbasiertes-Tracking

<!-- BEGIN etracker code ETRC 3.0 --><script

type="text/javascript">document.write(String.fromCharCode(60)+"scr

ipt type=\"text/javascript\" src=\"http"+

("https:"==document.location.protocol?"s":"")+"://code.etracker.com/

t.js?et=b9xpM9\">"+String.fromCharCode(60)+"/script>");</

script><!-- etracker PARAMETER 3.0 --><script

type="text/javascript">var et_pagename = "Suche";var et_areas

= "Suche";</script><!-- etracker PARAMETER END --><script

type="text/javascript">_etc();</script><noscript><p><a

href="www.etracker.com"><img style="border:0px;" alt=""

src="http://www.etracker.com/nscnt.php?et=b9xpM9"

/></a></p></noscript><!-- etracker CODE END -->

Page 15: Bibliotheken im Spannungsfeld zwischen Nutzungsmessung und Datenschutz

Pixelbasiertes Tracking

Contra-ArgumentePro-Argumente

+ Eindeutige Nutzererkennung

via Tracking-ID+ Höhere Genauigkeit+ Umfangreiche Informationen

über das System der Nutzer+ Ergebnisse stehen in Echtzeit

zur Verfügung+ Robots müssen nicht gefiltert

werden

- Code muss in Webseiten

integriert werden- Komplexe Auswertungen

erfordern hohen Aufwand- Verwendung von Cookies- Keine Robots & Fehlercodes

Page 16: Bibliotheken im Spannungsfeld zwischen Nutzungsmessung und Datenschutz

Vergleich Webserver-Logfiles vs. Tracking

Logfile Analyse Pixelbasiertes Tracking

Logfiles automatisch vorhanden Erfassung nach Integration des Codes

Protokollierung von Robots (Nahezu) keine Zugriffe von Robots

Browser-Cache und Proxy-Server

verhindern Zählung aller Zugriffe

Kein Zwischenspeichern des Tracking-

Pixels

Identifikation des Nutzers über die

IP-Adresse ungenau

Identifikation des Nutzers via Tracking-

ID / Cookies relativ genauer

Einfache Generierung von Zahlen

(primär Traffic-Metriken)

Komplexe Auswertung möglich

(Traffic- und Erfolgs-Metriken)

Page 17: Bibliotheken im Spannungsfeld zwischen Nutzungsmessung und Datenschutz

Seite 17

Rechtliche Rahmenbedingungen

Informationelle Selbstbestimmung (Rechtsprechung BVerfG) Selbstbestimmte Verwendung personenbezogener Daten

Bundesdatenschutzgesetz BSDG

Landesdatenschutzgesetze LDSG

Telemediengesetz TMG

Page 18: Bibliotheken im Spannungsfeld zwischen Nutzungsmessung und Datenschutz

Seite 18

Bundesdatenschutzgesetz BDSG Persönlichkeitsrechte schützen Personenbezogene Daten

Datensparsamkeit Pseudonymisierung / Anonymisierung von Daten wenn möglich Regelungen bei Auftragsdatenverarbeitung durch Dienstleister

Page 19: Bibliotheken im Spannungsfeld zwischen Nutzungsmessung und Datenschutz

Seite 19

Telemediengesetz TMG Erhebung und Verwendung von Nutzungsdaten

Personenbezogen Pseudonymisiert

Widerspruchsrecht des Nutzers

Page 20: Bibliotheken im Spannungsfeld zwischen Nutzungsmessung und Datenschutz

IP-Adresse ein personenbezogenes Datum?

Datenschützer sehen die IP-Adresse als personenbezogenes Datum

Contra-ArgumentePro-Argumente

+ Internet Service Provider kann

die verwendete IP-Adresse

einer Person zuordnen+ Von einer Erfassung muss

ausgegangen werden+ Betreiber kann dies u.U. in

Verbindung mit Sign-In-

Diensten

- Nur der ISP kann die IP-

Adresse einer Person zuordnen

- ISP erfasst u.U. die Identität gar

nicht

Deutschland: Düsseldorfer Kreis http://de.wikipedia.org/wiki/D%C3%BCsseldorfer_Kreis EU: Artikel-29-Datenschutzgruppe http://de.wikipedia.org/wiki/Artikel-29-Datenschutzgruppe

Page 21: Bibliotheken im Spannungsfeld zwischen Nutzungsmessung und Datenschutz

Seite 21

Rechtliche Rahmenbedingungen - Konsequenzen Persönliche/personenbezogene Daten nur mit Einwilligung erheben Möglichkeiten zum Widerspruch anbieten (Opt-Out) Anonymisierung der IP-Adresse innerhalb von 7 Tagen

IP Adresse 192.168.1.17 192.168.x.x / md5 hash (ip+salt) Vertragliche Regelung mit Tracking-Dienstleister treffen, wenn

dessen Allgemeine Geschäftsbedingungen nicht ausreichen Datenschutzerklärung, Policy verfassen

Unabhängige Landeszentrum für Datenschutz Schleswig-Holstein (ULD): FAQ IP-Adressen und andere Nutzungsdatenhttps://www.datenschutzzentrum.de/ip-adressen/

Page 22: Bibliotheken im Spannungsfeld zwischen Nutzungsmessung und Datenschutz

Google Analytics legal nutzbar?

ULD: Derzeit ist Google Analytics in Deutschland nicht legal nutzbar.

Contra-ArgumentePro-Argumente

+ Eigenes Opt-Out könnte

programmiert werden+ Die IP-Adresse kann gekürzt

werden _anonymizeIp()

- Widerspruch/Opt-Out nur durch

Browserspezifisches Plug-In- Die IP-Adresse wird vor einer

Kürzung in die USA übermittelt- Unklar ob gesammelte Daten

gelöscht werden können- (Vertraglich zu regelnde)

UnklarheitenStellungnahme des ULD: Datenschutzrechtliche Bewertung des Einsatzes von Google Analyticshttps://www.datenschutzzentrum.de/tracking/20090123_GA_stellungnahme.pdf

Page 23: Bibliotheken im Spannungsfeld zwischen Nutzungsmessung und Datenschutz

Google Analytics legal nutzbar?

M.M. Maisch: Google Analytics ist in Deutschland legal nutzbar.

Contra-ArgumentePro-Argumente

+ Pixel-Bereitstellung zur

Webanalyse ist ein Dienst

gemäß TMG § 15 Abs. 1+ Nutzungsdaten werden von

Google direkt erhoben

- Website ist der Dienst- Nutzerdaten werden Dritten

zugänglich gemacht, entspricht

Auftragsdatenverarbeitung

gemäß BDSG § 11

Michael Marc Maisch: Datenschutz bei Google Analytics: Kritik an digitalen Fährtenlesern .http://www.lto.de/de/html/nachrichten/2520/datenschutz_bei_google_analytics_kritik_an_digitalen_faehrtenlesern/ ULD: FAQ IP-Adressen und andere Nutzungsdaten https://www.datenschutzzentrum.de/ip-adressen/

Page 24: Bibliotheken im Spannungsfeld zwischen Nutzungsmessung und Datenschutz

Seite 24

Beispiel Service Policy / Datenschutzerklärung Anonyme Datenerhebung

Anonyme Nutzung ist möglich Erhebung und Verarbeitung personenbezogener Daten

Freiwillig, z.B. für Newsletter Nutzung und Weitergabe personenbezogener Daten

Mit Einwilligung, Widerruf möglich Bearbeitung der Anfragen ,Werbung, Optimierung des

Angebotes keine Weitergabe an Dritte

Export und Verarbeitung von Daten in Staaten außerhalb des

Europäischen Wirtschaftsraumes Questionpoint (USA, 90 Tage)

Page 25: Bibliotheken im Spannungsfeld zwischen Nutzungsmessung und Datenschutz

Seite 25

Beispiel Service Policy / Datenschutzerklärung Cookies

Zweck, Möglichkeit der Deaktivierung Webanalytics

Marketing- und Optimierung Pseudonyme Nutzungsprofile Keine persönliche Identifikation / Personifizierung Widerspruchsmöglichkeit

http://www.etracker.de/privacy?et=b9xWmg Externe Links

Kein Einfluss auf den Inhalt

EconBiz – Datenschutz http://econbiz.de/index.php?id=privacy

Page 26: Bibliotheken im Spannungsfeld zwischen Nutzungsmessung und Datenschutz

Fragen & Diskussion