Aufgabe 2 Klausur ss2012

Moderator: Web Mining

quandui
Neuling
Neuling
Beiträge: 5
Registriert: 30. Jan 2013 11:06

Aufgabe 2 Klausur ss2012

Beitrag von quandui »

2.a hab ich gelöst wie :
ca = 64
cb = 54
cc = 66
für "web mining"
Aber ich weiße nicht was genau muss ich weiter machen .... kann jemand mir erklären ?

Adrian
Neuling
Neuling
Beiträge: 8
Registriert: 22. Mär 2010 16:33

Re: Aufgabe 2 Klausur ss2012

Beitrag von Adrian »

Du musst die Buchstaben klassifizieren und die Klassifikation mit der echten Klasse vergleichen.
Das muss dann in der Matrix eingetragen werden und somit kann die Accuracy berechnet werden.

rhanne
Neuling
Neuling
Beiträge: 8
Registriert: 23. Jul 2012 19:57

Re: Aufgabe 2 Klausur ss2012

Beitrag von rhanne »

Also ich habe da auch Schwierigkeiten:
Es wird ja die Klasse als Ergebnis der Klassifikation gewählt,
wo der Archivgrößen-Unterschied am geringsten ist - wie lässt
sich der Unterschied der drei Archive hier bestimmen?

Zwähn
Erstie
Erstie
Beiträge: 18
Registriert: 14. Jun 2010 15:33

Re: Aufgabe 2 Klausur ss2012

Beitrag von Zwähn »

Der "Unterschied der Archive" ist bereits gegeben durch die Übersetzungstabelle des Kompressions-Wörterbuchs.
Du schaust einfach in der Tabelle nach, für zB Dokument "b" wird die Klasse B vorhergesagt, denn in der Klasse B benötigt Dokument "b" nur 8 Bit, in Klasse A und C jedoch 10 Bit.
Damit trägst du dann in der Zeile für A und der Spalte für B das "b" ein. Und das machst du dann für alle gegebenen Buchstaben in Aufgabe 2-b.
Bei der Berechnung der Genauigkeit bin ich mir hier selbst nicht ganz so sicher, ist d (nicht das Dokument "d", sondern die nicht relevanten & nicht zurückgeholten) = 0?
Wenn d = 0 -> Accuracy = 1/2.

proto
Neuling
Neuling
Beiträge: 6
Registriert: 12. Mai 2013 18:59

Re: Aufgabe 2 Klausur ss2012

Beitrag von proto »

2-a) cB vorhergesagt, da am wenigsten Bits (54) benötigt

2-b) acc= 3/5

2-c)
A: R=1/4; P=1
B: R=2/3; P=1/2
C: R=1; P=3/5

Macro: avg.R=23/36; avg.P=7/10
Micro: avg.R=3/5; avg.P=3/5

2-d) Multi-Label-Klassifikation, z.B. LP, BR

Hat jemand was anderes raus?

Zwähn
Erstie
Erstie
Beiträge: 18
Registriert: 14. Jun 2010 15:33

Re: Aufgabe 2 Klausur ss2012

Beitrag von Zwähn »

Ich komme beim Rechnen auf die selben Ergebnisse. Hatte heute Vormittag ein Dokument noch falsch eingeordnet, deswegen kam ich da auf 1/2 für Acc bei der 2-b).
Und bei 2-d) würde ich die selben Verfahren auflisten (Label Powerset und Binary Relevance).

marek
Mausschubser
Mausschubser
Beiträge: 85
Registriert: 18. Okt 2007 15:24
Wohnort: DA

Re: Aufgabe 2 Klausur ss2012

Beitrag von marek »

Ich habe auch die gleichen Ergebnisse. Allerdings frage ich mich, was die Archivgrößen in der 1. Tabelle zu bedeuten haben. Die kommen bei eurer Rechnung auch nicht zur Anwendung, wie ich sehe?

Antworten

Zurück zu „Web Mining“