Post on 08-Feb-2016
description
k-Anonymity Überblick und Diskussion
von Sebastian Sebald
15. Juli 2010
Vortrag im Rahmen des Seminars"Sicherheitstechnologien der Informationsgesellschaft"
k-Anonymity - Überblick und Diskussion 2
Übersicht
Veröffentlichen von anonymisierten Daten
Angriff auf anonyme Daten
Das k-Anonymity Modell
Identifikation von Personen
15.07.2010
k-Anonymity - Überblick und Diskussion 3
Veröffentlichen von anonymisierten Daten
Name Geburtsdatum Geschlecht PLZ Krankheit
Hans Hauck 17. Apr 65 M 79098 Impotenz
Peter Petersen 31. Juli 65 M 79096 Adipositas
Karl Kleber 17. Jan 65 M 79098 Bluthochdruck
Till Thomas 5. Juli 83 M 79331 Schizophrenie
Frank Faber 31. Dez 81 M 79336 Diabetes
Sandra Schmid 5. Juli 83 W 79338 Bronchitis
Lieschen Lauer 31. Okt 83 W 79331 Magersucht
15.07.2010
Entfernen von eindeutigen Identifikatoren
Können die Personen nicht mehr identifiziert werden?
k-Anonymity - Überblick und Diskussion 4
Bekannt, dass Lieschen in den Daten enthalten ist
Wissen über die anonymisierten Daten
15.07.2010
5
Re-Identification by Linking
15.07.2010 k-Anonymity - Überblick und Diskussion
Geburtsdatum Geschlecht PLZ Krankheit
17. Apr 65 M 79098 Impotenz
31. Juli 65 M 79096 Adipositas
17. Jan 65 M 79098 Bluthochdruck
5. Juli 83 M 79331 Schizophrenie
31. Dez 81 M 79336 Diabetes
5. Juli 83 W 79338 Bronchitis
31. Okt 83 W 79331 Magersucht
Verknüpfen der Datensätze miteinander
k-Anonymity - Überblick und Diskussion 6
Quasi-Identifier
Menge von Attributen, die kombiniert mit externen Daten Personen eindeutig identifizieren
15.07.2010
Name Geburtsdatum Geschlecht PLZ KrankheitHans Hauck 17. Apr 65 M 79098 Impotenz
Peter Petersen 31. Juli 65 M 79096 Adipositas
Karl Kleber 17. Jan 65 M 79098 Bluthochdruck
Till Thomas 5. Juli 83 M 79331 Schizophrenie
Frank Faber 31. Dez 81 M 79336 Diabetes
Sandra Schmid 5. Juli 83 W 79338 Bronchitis
Lieschen Lauer 31. Okt 83 W 79331 Magersucht
Quasi-IdentifierEindeutige Identifikatoren
k-Anonymity - Überblick und Diskussion 7
k-Anonymity Modell
k-Anonymity ist erfüllt, wenn: k Personen mit derselben
Wertekombination der Quasi-Identifier existieren
15.07.2010
k-Anonymity - Überblick und Diskussion 8
Beispiel: k-Anonymity
15.07.2010
Name Geburtsdatum Geschlecht PLZ Krankheit
Hans Hauck 17. Apr 65 M 79098 Impotenz
Peter Petersen 31. Juli 65 M 79096 Adipositas
Karl Kleber 17. Jan 65 M 79098 Bluthochdruck
Till Thomas 5. Juli 83 M 79331 Schizophrenie
Frank Faber 31. Dez 81 M 79336 Diabetes
Sandra Schmid 5. Juli 83 W 79338 Bronchitis
Lieschen Lauer 31. Okt 83 W 79331 Magersucht
Entfernen der eindeutigen Identifikatoren durch Supression
Quasi-IdentifierEindeutige Identifikatoren
k-Anonymity - Überblick und Diskussion 9
Beispiel: k-Anonymity
15.07.2010
Name Geburtsdatum Geschlecht PLZ Krankheit
* 17. Apr 65 M 79098 Impotenz
* 31. Juli 65 M 79096 Adipositas
* 17. Jan 65 M 79098 Bluthochdruck
* 5. Juli 83 M 79331 Schizophrenie
* 31. Dez 81 M 79336 Diabetes
* 5. Juli 83 W 79338 Bronchitis
* 31. Okt 83 W 79331 Magersucht
Quasi-IdentifierEindeutige Identifikatoren
k-Anonymity - Überblick und Diskussion 10
Beispiel: k-Anonymity
15.07.2010
Geburtsdatum Geschlecht PLZ Krankheit
17. Apr 65 M 79098 Impotenz
31. Juli 65 M 79096 Adipositas
17. Jan 65 M 79098 Bluthochdruck
5. Juli 83 M 79331 Schizophrenie
31. Dez 81 M 79336 Diabetes
5. Juli 83 W 79338 Bronchitis
31. Okt 83 W 79331 Magersucht
Quasi-Identifier
k-Anonymity - Überblick und Diskussion 11
Beispiel: k-Anonymity
15.07.2010
Geburtsdatum Geschlecht PLZ Krankheit
17. Apr 65 M 79098 Impotenz
31. Juli 65 M 79096 Adipositas
17. Jan 65 M 79098 Bluthochdruck
5. Juli 83 M 79331 Schizophrenie
31. Dez 81 M 79336 Diabetes
5. Juli 83 W 79338 Bronchitis
31. Okt 83 W 79331 Magersucht
Quasi-Identifier
Generalisieren von Geburtsdatum
k-Anonymity - Überblick und Diskussion 12
Beispiel: k-Anonymity
15.07.2010
Geburtsdatum Geschlecht PLZ Krankheit
'65 M 79098 Impotenz
'65 M 79096 Adipositas
'65 M 79098 Bluthochdruck
5. Juli 83 M 79331 Schizophrenie
31. Dez 81 M 79336 Diabetes
5. Juli 83 W 79338 Bronchitis
31. Okt 83 W 79331 Magersucht
Quasi-Identifier
Generalisieren von PLZ
k-Anonymity - Überblick und Diskussion 13
Beispiel: k-Anonymity
15.07.2010
Geburtsdatum Geschlecht PLZ Krankheit
'65 M 7909* Impotenz
'65 M 7909* Adipositas
'65 M 7909* Bluthochdruck
5. Juli 83 M 79331 Schizophrenie
31. Dez 81 M 79336 Diabetes
5. Juli 83 W 79338 Bronchitis
31. Okt 83 W 79331 Magersucht
Quasi-Identifier
k-Anonymity - Überblick und Diskussion 14
Beispiel: k-Anonymity
15.07.2010
Geburtsdatum Geschlecht PLZ Krankheit
'65 M 7909* Impotenz
'65 M 7909* Adipositas
'65 M 7909* Bluthochdruck
5. Juli 83 M 79331 Schizophrenie
31. Dez 81 M 79336 Diabetes
5. Juli 83 W 79338 Bronchitis
31. Okt 83 W 79331 Magersucht
Quasi-Identifier
Generalisieren von Geburtsdatum
k-Anonymity - Überblick und Diskussion 15
Beispiel: k-Anonymity
15.07.2010
Geburtsdatum Geschlecht PLZ Krankheit
'65 M 7909* Impotenz
'65 M 7909* Adipositas
'65 M 7909* Bluthochdruck
'81-'83 M 79331 Schizophrenie
'81-'83 M 79336 Diabetes
'81-'83 W 79338 Bronchitis
'81-'83 W 79331 Magersucht
Quasi-Identifier
Generalisieren von PLZ
k-Anonymity - Überblick und Diskussion 16
Beispiel: k-Anonymity
15.07.2010
Geburtsdatum Geschlecht PLZ Krankheit
'65 M 7909* Impotenz
'65 M 7909* Adipositas
'65 M 7909* Bluthochdruck
'81-'83 M 7933* Schizophrenie
'81-'83 M 7933* Diabetes
'81-'83 W 7933* Bronchitis
'81-'83 W 7933* Magersucht
Quasi-Identifier
k-Anonymity - Überblick und Diskussion 17
Beispiel: k-Anonymity
15.07.2010
Geburtsdatum Geschlecht PLZ Krankheit
'65 M 7909* Impotenz
'65 M 7909* Adipositas
'65 M 7909* Bluthochdruck
'81-'83 M 7933* Schizophrenie
'81-'83 M 7933* Diabetes
'81-'83 W 7933* Bronchitis
'81-'83 W 7933* Magersucht
2-anonyme Tabelle
k-Anonymity - Überblick und Diskussion 18
Zusammenfassung: k-Anonymity Keine Verknüpfung über die Quasi-
Identifier möglich um weniger als k Personen zu erhalten
Grad von Anonymität
15.07.2010
k-Anonymity - Überblick und Diskussion 19
Identifikation von Personen Vor k-Anonymity
Eindeutige Identifikatoren (Name, Sozialversicherungsnummer)
Durch k-Anonymity Quasi-Identifier (Postleitzahl, Geschlecht)
15.07.2010
k-Anonymity - Überblick und Diskussion 20
Identifikation von Personen
15.07.2010
Können Personen nicht mehr identifiziert werden?
k-Anonymity - Überblick und Diskussion 21
Identifikation von Personen
15.07.2010
The versatility and power of re-identification algorithms imply that terms such as
"personally identifiable" and "quasi-identifier" simply have no technical
meaning. While some attributes may be uniquely identifying on their own, any
attribute can be identifying in combination with others.- Arvind Narayanan and Vitaly Shmatikov, Myths and Fallacies of "Personally Identifiable Information"
"