Hausübung Aufgabe 3 k-Anonymität

mister_tt
Kernelcompilierer
Kernelcompilierer
Beiträge: 502
Registriert: 29. Sep 2008 15:54

Hausübung Aufgabe 3 k-Anonymität

Beitrag von mister_tt »

Hallo zusammen,

Für die k-Anonymität braucht man doch noch eine Information, welche Daten Quasi-Identifizierer sind, oder? Ohne macht k-Anonymität doch nicht so viel Sinn? Oder sollen wir aus "We need the information how many data to which website are transfered." schließen, dass diese beiden Spalten "egal" sind und alle anderen Spalten Quasi-Identifizierer sind?

Viele Grüße,
Simon

marco_ghiglieri
Mausschubser
Mausschubser
Beiträge: 46
Registriert: 6. Jun 2011 09:29

Re: Hausübung Aufgabe 3 k-Anonymität

Beitrag von marco_ghiglieri »

mister_tt hat geschrieben:Hallo zusammen,

Für die k-Anonymität braucht man doch noch eine Information, welche Daten Quasi-Identifizierer sind, oder? Ohne macht k-Anonymität doch nicht so viel Sinn? Oder sollen wir aus "We need the information how many data to which website are transfered." schließen, dass diese beiden Spalten "egal" sind und alle anderen Spalten Quasi-Identifizierer sind?

Viele Grüße,
Simon
1. Ja braucht man. Könnte man ja durch eine sinnvolle Annahme auswählen :-)
2. Ja stimmt auch :-)
3. Als egal würde ich sie nicht einstufen, da --- wenn der Datensatz behalten wird --- die Information erhalten bleiben muss.
Nach Problemen ist ja auch gefragt :-)

mister_tt
Kernelcompilierer
Kernelcompilierer
Beiträge: 502
Registriert: 29. Sep 2008 15:54

Re: Hausübung Aufgabe 3 k-Anonymität

Beitrag von mister_tt »

Joa, dann gehe ich mal davon aus, dass alles außer URL und Traffic Quasi-Identifier sind...

Komme mit der Aufgabe aber trotzdem nich ganz klar...
Zur b):
Ich wüsste nicht, dass das in der Vorlesung behandelt wurde... Was sind denn Anforderungen für neue Einträge? Wenn der Traffic nicht verändert werden soll, lässt man diese Spalte beim neuen Datensatz dann frei? Oder reicht es, wenn die Verhältnisse gleich bleiben?

Zur c):
Widersprechen sich "Minimize the dataset" und "No data should be removed" nicht?
"No data should be removed"... Okay, dann müssen aber wieder Datensätze eingefügt werden, oder?

marco_ghiglieri
Mausschubser
Mausschubser
Beiträge: 46
Registriert: 6. Jun 2011 09:29

Re: Hausübung Aufgabe 3 k-Anonymität

Beitrag von marco_ghiglieri »

mister_tt hat geschrieben:Joa, dann gehe ich mal davon aus, dass alles außer URL und Traffic Quasi-Identifier sind...

Komme mit der Aufgabe aber trotzdem nich ganz klar...
Zur b):
Ich wüsste nicht, dass das in der Vorlesung behandelt wurde... Was sind denn Anforderungen für neue Einträge? Wenn der Traffic nicht verändert werden soll, lässt man diese Spalte beim neuen Datensatz dann frei? Oder reicht es, wenn die Verhältnisse gleich bleiben?

Zur c):
Widersprechen sich "Minimize the dataset" und "No data should be removed" nicht?
"No data should be removed"... Okay, dann müssen aber wieder Datensätze eingefügt werden, oder?
Bei dieser Aufgabe gibt es mehere korrekte Lösungen.

Zu b) Da es nicht in der Vorlesung behandelt wurde, soll hier nur eine sinnvolle Erklärung gemacht werden. Frei (leer) lassen ist keine Option. Der Datensatz sollte gültig sein >> alle Felder haben ein Wert. Veränderungen sind evtl. auch eine Option.
zu c) Könnte passieren, dass Du was neues einfügen musst ;)

FeG
Endlosschleifenbastler
Endlosschleifenbastler
Beiträge: 182
Registriert: 6. Dez 2007 07:01

Re: Hausübung Aufgabe 3 k-Anonymität

Beitrag von FeG »

Hallo,

auf welche Referenz bezieht sich denn die Frage "Is a deanonymization possible ?" in b) bzw. "Can you deanonymize the dataset afterwards ?" in c) ? Ich meine, aus der anonymisierten Tabelle allein kann man natürlich erstmal gar nichts rauslesen; soll man deanonymisieren und dabei die Ausgangstabelle als zusätzliche Info heranziehen oder soll man Weblogs der Webseiteprovider annehmen oder ... ?

Gruß
FeG

Benutzeravatar
hymGo
Sonntagsinformatiker
Sonntagsinformatiker
Beiträge: 209
Registriert: 4. Okt 2009 23:17

Re: Hausübung Aufgabe 3 k-Anonymität

Beitrag von hymGo »

Ich hätte auch mal eine Frage und zwar zur Aufgabenteil a)

Ich bin auch von der folgenden Annahme ausgegangen:
mister_tt hat geschrieben:Joa, dann gehe ich mal davon aus, dass alles außer URL und Traffic Quasi-Identifier sind...
Jetzt wird bei diesem Aufgabenteil nach auftretenden Problemen gefragt. Jedoch hatte ich keine Probleme damit die
Daten auf k=2 (bzw. k >= 2, was aber bei k-Anonymität ja auch k=2 bedeuten sollte?) zu bringen .

Deswegen würde ich mich über einen kleinen Hinweis freuen ^^

Thorsten Peter
Windoof-User
Windoof-User
Beiträge: 27
Registriert: 18. Mai 2009 23:40

Re: Hausübung Aufgabe 3 k-Anonymität

Beitrag von Thorsten Peter »

Ich verstehe beim Aufgabenteil b) nicht, wie man durch das Hinzufügen von Zeilen eine Deanonymisierung erreichen können soll. Wenn ich eine Zeile hinzufüge mit Daten, die es so gar nicht gibt, dann kann ein Angreifer doch in der "Verknüpfungsdatenbank" nachschauen welche Quasiidentifizierer gültig sind (und welche offensichtlich nur ausgedacht sind) und somit gütlige von ungültigen Datensätzen unterscheiden?!

Benutzeravatar
JanM
Endlosschleifenbastler
Endlosschleifenbastler
Beiträge: 157
Registriert: 24. Aug 2010 10:58

Re: Hausübung Aufgabe 3 k-Anonymität

Beitrag von JanM »

Um jetzt auch noch mal eine vierte Frage zu stellen, bevor die anderen beantowrtet sind:
Ich kann mir das noch nicht so ganz mit der Punkteverteilung vorstellen. Wenn ich zum Beispiel die a und b komplett richtig und die c falsch habe, gibt es dann einen oder keinen punkt? also ab wann gibt es den Punkt, oder werden intern teilpunkte vergeben und diese dann gerundet?

funkypopcorn
Erstie
Erstie
Beiträge: 16
Registriert: 9. Apr 2011 00:07

Re: Hausübung Aufgabe 3 k-Anonymität

Beitrag von funkypopcorn »

*push*

marco_ghiglieri
Mausschubser
Mausschubser
Beiträge: 46
Registriert: 6. Jun 2011 09:29

Re: Hausübung Aufgabe 3 k-Anonymität

Beitrag von marco_ghiglieri »

JanM hat geschrieben:Um jetzt auch noch mal eine vierte Frage zu stellen, bevor die anderen beantowrtet sind:
Ich kann mir das noch nicht so ganz mit der Punkteverteilung vorstellen. Wenn ich zum Beispiel die a und b komplett richtig und die c falsch habe, gibt es dann einen oder keinen punkt? also ab wann gibt es den Punkt, oder werden intern teilpunkte vergeben und diese dann gerundet?
Keine Sorge um die Punkte. Hier werden wir großzügig sein...

marco_ghiglieri
Mausschubser
Mausschubser
Beiträge: 46
Registriert: 6. Jun 2011 09:29

Re: Hausübung Aufgabe 3 k-Anonymität

Beitrag von marco_ghiglieri »

hymGo hat geschrieben:Ich hätte auch mal eine Frage und zwar zur Aufgabenteil a)

Ich bin auch von der folgenden Annahme ausgegangen:
mister_tt hat geschrieben:Joa, dann gehe ich mal davon aus, dass alles außer URL und Traffic Quasi-Identifier sind...
Jetzt wird bei diesem Aufgabenteil nach auftretenden Problemen gefragt. Jedoch hatte ich keine Probleme damit die
Daten auf k=2 (bzw. k >= 2, was aber bei k-Anonymität ja auch k=2 bedeuten sollte?) zu bringen .

Deswegen würde ich mich über einen kleinen Hinweis freuen ^^
Sind Quasi-Identifier angegeben ? Werden alle Daten beibehalten ? Wird der Traffic verfälscht ? ...

marco_ghiglieri
Mausschubser
Mausschubser
Beiträge: 46
Registriert: 6. Jun 2011 09:29

Re: Hausübung Aufgabe 3 k-Anonymität

Beitrag von marco_ghiglieri »

Thorsten Peter hat geschrieben:Ich verstehe beim Aufgabenteil b) nicht, wie man durch das Hinzufügen von Zeilen eine Deanonymisierung erreichen können soll. Wenn ich eine Zeile hinzufüge mit Daten, die es so gar nicht gibt, dann kann ein Angreifer doch in der "Verknüpfungsdatenbank" nachschauen welche Quasiidentifizierer gültig sind (und welche offensichtlich nur ausgedacht sind) und somit gütlige von ungültigen Datensätzen unterscheiden?!
Du darfst in diesem Fall auch bestehende leicht modifizieren...

marco_ghiglieri
Mausschubser
Mausschubser
Beiträge: 46
Registriert: 6. Jun 2011 09:29

Re: Hausübung Aufgabe 3 k-Anonymität

Beitrag von marco_ghiglieri »

FeG hat geschrieben:Hallo,

auf welche Referenz bezieht sich denn die Frage "Is a deanonymization possible ?" in b) bzw. "Can you deanonymize the dataset afterwards ?" in c) ? Ich meine, aus der anonymisierten Tabelle allein kann man natürlich erstmal gar nichts rauslesen; soll man deanonymisieren und dabei die Ausgangstabelle als zusätzliche Info heranziehen oder soll man Weblogs der Webseiteprovider annehmen oder ... ?

Gruß
FeG
Je nachdem was du hinzugefügt hast, sollte es mehr oder weniger einfach möglich sein die Datenmenge zu deanonymisieren...

marco_ghiglieri
Mausschubser
Mausschubser
Beiträge: 46
Registriert: 6. Jun 2011 09:29

Re: Hausübung Aufgabe 3 k-Anonymität

Beitrag von marco_ghiglieri »

Heute morgen in der Sprechstunde ist herausgekommen,dass die letzte Teilaufgabe etwas unglücklich formuliert ist:
- Also mit "should not be removed" ist nur der Traffic gemeint. Alle anderen Daten können natürlich verändert und entfernt werden.

Antworten

Zurück zu „Archiv“