Hausübung Aufgabe 3 k-Anonymität
Hausübung Aufgabe 3 k-Anonymität
Hallo zusammen,
Für die k-Anonymität braucht man doch noch eine Information, welche Daten Quasi-Identifizierer sind, oder? Ohne macht k-Anonymität doch nicht so viel Sinn? Oder sollen wir aus "We need the information how many data to which website are transfered." schließen, dass diese beiden Spalten "egal" sind und alle anderen Spalten Quasi-Identifizierer sind?
Viele Grüße,
Simon
Für die k-Anonymität braucht man doch noch eine Information, welche Daten Quasi-Identifizierer sind, oder? Ohne macht k-Anonymität doch nicht so viel Sinn? Oder sollen wir aus "We need the information how many data to which website are transfered." schließen, dass diese beiden Spalten "egal" sind und alle anderen Spalten Quasi-Identifizierer sind?
Viele Grüße,
Simon
-
- Mausschubser
- Beiträge: 46
- Registriert: 6. Jun 2011 09:29
Re: Hausübung Aufgabe 3 k-Anonymität
1. Ja braucht man. Könnte man ja durch eine sinnvolle Annahme auswählenmister_tt hat geschrieben:Hallo zusammen,
Für die k-Anonymität braucht man doch noch eine Information, welche Daten Quasi-Identifizierer sind, oder? Ohne macht k-Anonymität doch nicht so viel Sinn? Oder sollen wir aus "We need the information how many data to which website are transfered." schließen, dass diese beiden Spalten "egal" sind und alle anderen Spalten Quasi-Identifizierer sind?
Viele Grüße,
Simon

2. Ja stimmt auch

3. Als egal würde ich sie nicht einstufen, da --- wenn der Datensatz behalten wird --- die Information erhalten bleiben muss.
Nach Problemen ist ja auch gefragt

Re: Hausübung Aufgabe 3 k-Anonymität
Joa, dann gehe ich mal davon aus, dass alles außer URL und Traffic Quasi-Identifier sind...
Komme mit der Aufgabe aber trotzdem nich ganz klar...
Zur b):
Ich wüsste nicht, dass das in der Vorlesung behandelt wurde... Was sind denn Anforderungen für neue Einträge? Wenn der Traffic nicht verändert werden soll, lässt man diese Spalte beim neuen Datensatz dann frei? Oder reicht es, wenn die Verhältnisse gleich bleiben?
Zur c):
Widersprechen sich "Minimize the dataset" und "No data should be removed" nicht?
"No data should be removed"... Okay, dann müssen aber wieder Datensätze eingefügt werden, oder?
Komme mit der Aufgabe aber trotzdem nich ganz klar...
Zur b):
Ich wüsste nicht, dass das in der Vorlesung behandelt wurde... Was sind denn Anforderungen für neue Einträge? Wenn der Traffic nicht verändert werden soll, lässt man diese Spalte beim neuen Datensatz dann frei? Oder reicht es, wenn die Verhältnisse gleich bleiben?
Zur c):
Widersprechen sich "Minimize the dataset" und "No data should be removed" nicht?
"No data should be removed"... Okay, dann müssen aber wieder Datensätze eingefügt werden, oder?
-
- Mausschubser
- Beiträge: 46
- Registriert: 6. Jun 2011 09:29
Re: Hausübung Aufgabe 3 k-Anonymität
Bei dieser Aufgabe gibt es mehere korrekte Lösungen.mister_tt hat geschrieben:Joa, dann gehe ich mal davon aus, dass alles außer URL und Traffic Quasi-Identifier sind...
Komme mit der Aufgabe aber trotzdem nich ganz klar...
Zur b):
Ich wüsste nicht, dass das in der Vorlesung behandelt wurde... Was sind denn Anforderungen für neue Einträge? Wenn der Traffic nicht verändert werden soll, lässt man diese Spalte beim neuen Datensatz dann frei? Oder reicht es, wenn die Verhältnisse gleich bleiben?
Zur c):
Widersprechen sich "Minimize the dataset" und "No data should be removed" nicht?
"No data should be removed"... Okay, dann müssen aber wieder Datensätze eingefügt werden, oder?
Zu b) Da es nicht in der Vorlesung behandelt wurde, soll hier nur eine sinnvolle Erklärung gemacht werden. Frei (leer) lassen ist keine Option. Der Datensatz sollte gültig sein >> alle Felder haben ein Wert. Veränderungen sind evtl. auch eine Option.
zu c) Könnte passieren, dass Du was neues einfügen musst

Re: Hausübung Aufgabe 3 k-Anonymität
Hallo,
auf welche Referenz bezieht sich denn die Frage "Is a deanonymization possible ?" in b) bzw. "Can you deanonymize the dataset afterwards ?" in c) ? Ich meine, aus der anonymisierten Tabelle allein kann man natürlich erstmal gar nichts rauslesen; soll man deanonymisieren und dabei die Ausgangstabelle als zusätzliche Info heranziehen oder soll man Weblogs der Webseiteprovider annehmen oder ... ?
Gruß
FeG
auf welche Referenz bezieht sich denn die Frage "Is a deanonymization possible ?" in b) bzw. "Can you deanonymize the dataset afterwards ?" in c) ? Ich meine, aus der anonymisierten Tabelle allein kann man natürlich erstmal gar nichts rauslesen; soll man deanonymisieren und dabei die Ausgangstabelle als zusätzliche Info heranziehen oder soll man Weblogs der Webseiteprovider annehmen oder ... ?
Gruß
FeG
Re: Hausübung Aufgabe 3 k-Anonymität
Ich hätte auch mal eine Frage und zwar zur Aufgabenteil a)
Ich bin auch von der folgenden Annahme ausgegangen:
Daten auf k=2 (bzw. k >= 2, was aber bei k-Anonymität ja auch k=2 bedeuten sollte?) zu bringen .
Deswegen würde ich mich über einen kleinen Hinweis freuen ^^
Ich bin auch von der folgenden Annahme ausgegangen:
Jetzt wird bei diesem Aufgabenteil nach auftretenden Problemen gefragt. Jedoch hatte ich keine Probleme damit diemister_tt hat geschrieben:Joa, dann gehe ich mal davon aus, dass alles außer URL und Traffic Quasi-Identifier sind...
Daten auf k=2 (bzw. k >= 2, was aber bei k-Anonymität ja auch k=2 bedeuten sollte?) zu bringen .
Deswegen würde ich mich über einen kleinen Hinweis freuen ^^
-
- Windoof-User
- Beiträge: 27
- Registriert: 18. Mai 2009 23:40
Re: Hausübung Aufgabe 3 k-Anonymität
Ich verstehe beim Aufgabenteil b) nicht, wie man durch das Hinzufügen von Zeilen eine Deanonymisierung erreichen können soll. Wenn ich eine Zeile hinzufüge mit Daten, die es so gar nicht gibt, dann kann ein Angreifer doch in der "Verknüpfungsdatenbank" nachschauen welche Quasiidentifizierer gültig sind (und welche offensichtlich nur ausgedacht sind) und somit gütlige von ungültigen Datensätzen unterscheiden?!
Re: Hausübung Aufgabe 3 k-Anonymität
Um jetzt auch noch mal eine vierte Frage zu stellen, bevor die anderen beantowrtet sind:
Ich kann mir das noch nicht so ganz mit der Punkteverteilung vorstellen. Wenn ich zum Beispiel die a und b komplett richtig und die c falsch habe, gibt es dann einen oder keinen punkt? also ab wann gibt es den Punkt, oder werden intern teilpunkte vergeben und diese dann gerundet?
Ich kann mir das noch nicht so ganz mit der Punkteverteilung vorstellen. Wenn ich zum Beispiel die a und b komplett richtig und die c falsch habe, gibt es dann einen oder keinen punkt? also ab wann gibt es den Punkt, oder werden intern teilpunkte vergeben und diese dann gerundet?
-
- Erstie
- Beiträge: 16
- Registriert: 9. Apr 2011 00:07
-
- Mausschubser
- Beiträge: 46
- Registriert: 6. Jun 2011 09:29
Re: Hausübung Aufgabe 3 k-Anonymität
Keine Sorge um die Punkte. Hier werden wir großzügig sein...JanM hat geschrieben:Um jetzt auch noch mal eine vierte Frage zu stellen, bevor die anderen beantowrtet sind:
Ich kann mir das noch nicht so ganz mit der Punkteverteilung vorstellen. Wenn ich zum Beispiel die a und b komplett richtig und die c falsch habe, gibt es dann einen oder keinen punkt? also ab wann gibt es den Punkt, oder werden intern teilpunkte vergeben und diese dann gerundet?
-
- Mausschubser
- Beiträge: 46
- Registriert: 6. Jun 2011 09:29
Re: Hausübung Aufgabe 3 k-Anonymität
Sind Quasi-Identifier angegeben ? Werden alle Daten beibehalten ? Wird der Traffic verfälscht ? ...hymGo hat geschrieben:Ich hätte auch mal eine Frage und zwar zur Aufgabenteil a)
Ich bin auch von der folgenden Annahme ausgegangen:Jetzt wird bei diesem Aufgabenteil nach auftretenden Problemen gefragt. Jedoch hatte ich keine Probleme damit diemister_tt hat geschrieben:Joa, dann gehe ich mal davon aus, dass alles außer URL und Traffic Quasi-Identifier sind...
Daten auf k=2 (bzw. k >= 2, was aber bei k-Anonymität ja auch k=2 bedeuten sollte?) zu bringen .
Deswegen würde ich mich über einen kleinen Hinweis freuen ^^
-
- Mausschubser
- Beiträge: 46
- Registriert: 6. Jun 2011 09:29
Re: Hausübung Aufgabe 3 k-Anonymität
Du darfst in diesem Fall auch bestehende leicht modifizieren...Thorsten Peter hat geschrieben:Ich verstehe beim Aufgabenteil b) nicht, wie man durch das Hinzufügen von Zeilen eine Deanonymisierung erreichen können soll. Wenn ich eine Zeile hinzufüge mit Daten, die es so gar nicht gibt, dann kann ein Angreifer doch in der "Verknüpfungsdatenbank" nachschauen welche Quasiidentifizierer gültig sind (und welche offensichtlich nur ausgedacht sind) und somit gütlige von ungültigen Datensätzen unterscheiden?!
-
- Mausschubser
- Beiträge: 46
- Registriert: 6. Jun 2011 09:29
Re: Hausübung Aufgabe 3 k-Anonymität
Je nachdem was du hinzugefügt hast, sollte es mehr oder weniger einfach möglich sein die Datenmenge zu deanonymisieren...FeG hat geschrieben:Hallo,
auf welche Referenz bezieht sich denn die Frage "Is a deanonymization possible ?" in b) bzw. "Can you deanonymize the dataset afterwards ?" in c) ? Ich meine, aus der anonymisierten Tabelle allein kann man natürlich erstmal gar nichts rauslesen; soll man deanonymisieren und dabei die Ausgangstabelle als zusätzliche Info heranziehen oder soll man Weblogs der Webseiteprovider annehmen oder ... ?
Gruß
FeG
-
- Mausschubser
- Beiträge: 46
- Registriert: 6. Jun 2011 09:29
Re: Hausübung Aufgabe 3 k-Anonymität
Heute morgen in der Sprechstunde ist herausgekommen,dass die letzte Teilaufgabe etwas unglücklich formuliert ist:
- Also mit "should not be removed" ist nur der Traffic gemeint. Alle anderen Daten können natürlich verändert und entfernt werden.
- Also mit "should not be removed" ist nur der Traffic gemeint. Alle anderen Daten können natürlich verändert und entfernt werden.