Seite 1 von 1

Hausübung Aufgabe 3 k-Anonymität

Verfasst: 15. Jun 2011 14:55
von mister_tt
Hallo zusammen,

Für die k-Anonymität braucht man doch noch eine Information, welche Daten Quasi-Identifizierer sind, oder? Ohne macht k-Anonymität doch nicht so viel Sinn? Oder sollen wir aus "We need the information how many data to which website are transfered." schließen, dass diese beiden Spalten "egal" sind und alle anderen Spalten Quasi-Identifizierer sind?

Viele Grüße,
Simon

Re: Hausübung Aufgabe 3 k-Anonymität

Verfasst: 15. Jun 2011 16:12
von marco_ghiglieri
mister_tt hat geschrieben:Hallo zusammen,

Für die k-Anonymität braucht man doch noch eine Information, welche Daten Quasi-Identifizierer sind, oder? Ohne macht k-Anonymität doch nicht so viel Sinn? Oder sollen wir aus "We need the information how many data to which website are transfered." schließen, dass diese beiden Spalten "egal" sind und alle anderen Spalten Quasi-Identifizierer sind?

Viele Grüße,
Simon
1. Ja braucht man. Könnte man ja durch eine sinnvolle Annahme auswählen :-)
2. Ja stimmt auch :-)
3. Als egal würde ich sie nicht einstufen, da --- wenn der Datensatz behalten wird --- die Information erhalten bleiben muss.
Nach Problemen ist ja auch gefragt :-)

Re: Hausübung Aufgabe 3 k-Anonymität

Verfasst: 20. Jun 2011 14:57
von mister_tt
Joa, dann gehe ich mal davon aus, dass alles außer URL und Traffic Quasi-Identifier sind...

Komme mit der Aufgabe aber trotzdem nich ganz klar...
Zur b):
Ich wüsste nicht, dass das in der Vorlesung behandelt wurde... Was sind denn Anforderungen für neue Einträge? Wenn der Traffic nicht verändert werden soll, lässt man diese Spalte beim neuen Datensatz dann frei? Oder reicht es, wenn die Verhältnisse gleich bleiben?

Zur c):
Widersprechen sich "Minimize the dataset" und "No data should be removed" nicht?
"No data should be removed"... Okay, dann müssen aber wieder Datensätze eingefügt werden, oder?

Re: Hausübung Aufgabe 3 k-Anonymität

Verfasst: 20. Jun 2011 15:36
von marco_ghiglieri
mister_tt hat geschrieben:Joa, dann gehe ich mal davon aus, dass alles außer URL und Traffic Quasi-Identifier sind...

Komme mit der Aufgabe aber trotzdem nich ganz klar...
Zur b):
Ich wüsste nicht, dass das in der Vorlesung behandelt wurde... Was sind denn Anforderungen für neue Einträge? Wenn der Traffic nicht verändert werden soll, lässt man diese Spalte beim neuen Datensatz dann frei? Oder reicht es, wenn die Verhältnisse gleich bleiben?

Zur c):
Widersprechen sich "Minimize the dataset" und "No data should be removed" nicht?
"No data should be removed"... Okay, dann müssen aber wieder Datensätze eingefügt werden, oder?
Bei dieser Aufgabe gibt es mehere korrekte Lösungen.

Zu b) Da es nicht in der Vorlesung behandelt wurde, soll hier nur eine sinnvolle Erklärung gemacht werden. Frei (leer) lassen ist keine Option. Der Datensatz sollte gültig sein >> alle Felder haben ein Wert. Veränderungen sind evtl. auch eine Option.
zu c) Könnte passieren, dass Du was neues einfügen musst ;)

Re: Hausübung Aufgabe 3 k-Anonymität

Verfasst: 29. Jun 2011 13:43
von FeG
Hallo,

auf welche Referenz bezieht sich denn die Frage "Is a deanonymization possible ?" in b) bzw. "Can you deanonymize the dataset afterwards ?" in c) ? Ich meine, aus der anonymisierten Tabelle allein kann man natürlich erstmal gar nichts rauslesen; soll man deanonymisieren und dabei die Ausgangstabelle als zusätzliche Info heranziehen oder soll man Weblogs der Webseiteprovider annehmen oder ... ?

Gruß
FeG

Re: Hausübung Aufgabe 3 k-Anonymität

Verfasst: 29. Jun 2011 19:02
von hymGo
Ich hätte auch mal eine Frage und zwar zur Aufgabenteil a)

Ich bin auch von der folgenden Annahme ausgegangen:
mister_tt hat geschrieben:Joa, dann gehe ich mal davon aus, dass alles außer URL und Traffic Quasi-Identifier sind...
Jetzt wird bei diesem Aufgabenteil nach auftretenden Problemen gefragt. Jedoch hatte ich keine Probleme damit die
Daten auf k=2 (bzw. k >= 2, was aber bei k-Anonymität ja auch k=2 bedeuten sollte?) zu bringen .

Deswegen würde ich mich über einen kleinen Hinweis freuen ^^

Re: Hausübung Aufgabe 3 k-Anonymität

Verfasst: 30. Jun 2011 14:19
von Thorsten Peter
Ich verstehe beim Aufgabenteil b) nicht, wie man durch das Hinzufügen von Zeilen eine Deanonymisierung erreichen können soll. Wenn ich eine Zeile hinzufüge mit Daten, die es so gar nicht gibt, dann kann ein Angreifer doch in der "Verknüpfungsdatenbank" nachschauen welche Quasiidentifizierer gültig sind (und welche offensichtlich nur ausgedacht sind) und somit gütlige von ungültigen Datensätzen unterscheiden?!

Re: Hausübung Aufgabe 3 k-Anonymität

Verfasst: 30. Jun 2011 14:26
von JanM
Um jetzt auch noch mal eine vierte Frage zu stellen, bevor die anderen beantowrtet sind:
Ich kann mir das noch nicht so ganz mit der Punkteverteilung vorstellen. Wenn ich zum Beispiel die a und b komplett richtig und die c falsch habe, gibt es dann einen oder keinen punkt? also ab wann gibt es den Punkt, oder werden intern teilpunkte vergeben und diese dann gerundet?

Re: Hausübung Aufgabe 3 k-Anonymität

Verfasst: 5. Jul 2011 18:21
von funkypopcorn
*push*

Re: Hausübung Aufgabe 3 k-Anonymität

Verfasst: 5. Jul 2011 22:15
von marco_ghiglieri
JanM hat geschrieben:Um jetzt auch noch mal eine vierte Frage zu stellen, bevor die anderen beantowrtet sind:
Ich kann mir das noch nicht so ganz mit der Punkteverteilung vorstellen. Wenn ich zum Beispiel die a und b komplett richtig und die c falsch habe, gibt es dann einen oder keinen punkt? also ab wann gibt es den Punkt, oder werden intern teilpunkte vergeben und diese dann gerundet?
Keine Sorge um die Punkte. Hier werden wir großzügig sein...

Re: Hausübung Aufgabe 3 k-Anonymität

Verfasst: 5. Jul 2011 22:17
von marco_ghiglieri
hymGo hat geschrieben:Ich hätte auch mal eine Frage und zwar zur Aufgabenteil a)

Ich bin auch von der folgenden Annahme ausgegangen:
mister_tt hat geschrieben:Joa, dann gehe ich mal davon aus, dass alles außer URL und Traffic Quasi-Identifier sind...
Jetzt wird bei diesem Aufgabenteil nach auftretenden Problemen gefragt. Jedoch hatte ich keine Probleme damit die
Daten auf k=2 (bzw. k >= 2, was aber bei k-Anonymität ja auch k=2 bedeuten sollte?) zu bringen .

Deswegen würde ich mich über einen kleinen Hinweis freuen ^^
Sind Quasi-Identifier angegeben ? Werden alle Daten beibehalten ? Wird der Traffic verfälscht ? ...

Re: Hausübung Aufgabe 3 k-Anonymität

Verfasst: 5. Jul 2011 22:18
von marco_ghiglieri
Thorsten Peter hat geschrieben:Ich verstehe beim Aufgabenteil b) nicht, wie man durch das Hinzufügen von Zeilen eine Deanonymisierung erreichen können soll. Wenn ich eine Zeile hinzufüge mit Daten, die es so gar nicht gibt, dann kann ein Angreifer doch in der "Verknüpfungsdatenbank" nachschauen welche Quasiidentifizierer gültig sind (und welche offensichtlich nur ausgedacht sind) und somit gütlige von ungültigen Datensätzen unterscheiden?!
Du darfst in diesem Fall auch bestehende leicht modifizieren...

Re: Hausübung Aufgabe 3 k-Anonymität

Verfasst: 5. Jul 2011 22:19
von marco_ghiglieri
FeG hat geschrieben:Hallo,

auf welche Referenz bezieht sich denn die Frage "Is a deanonymization possible ?" in b) bzw. "Can you deanonymize the dataset afterwards ?" in c) ? Ich meine, aus der anonymisierten Tabelle allein kann man natürlich erstmal gar nichts rauslesen; soll man deanonymisieren und dabei die Ausgangstabelle als zusätzliche Info heranziehen oder soll man Weblogs der Webseiteprovider annehmen oder ... ?

Gruß
FeG
Je nachdem was du hinzugefügt hast, sollte es mehr oder weniger einfach möglich sein die Datenmenge zu deanonymisieren...

Re: Hausübung Aufgabe 3 k-Anonymität

Verfasst: 6. Jul 2011 15:06
von marco_ghiglieri
Heute morgen in der Sprechstunde ist herausgekommen,dass die letzte Teilaufgabe etwas unglücklich formuliert ist:
- Also mit "should not be removed" ist nur der Traffic gemeint. Alle anderen Daten können natürlich verändert und entfernt werden.