Lösungsvorschlag Klausur 06 Aufgabe 4

Moderator: Web Mining

sYsChOs
Windoof-User
Windoof-User
Beiträge: 28
Registriert: 9. Aug 2005 12:15

Lösungsvorschlag Klausur 06 Aufgabe 4

Beitrag von sYsChOs » 3. Jul 2008 18:54

Hi,
meine Vorschläge:

4-a)
p(+) = 1/2
p(braun|+) = 5/18
p(schwarz|+) = 4/18
p(gelb|+) = 4/18
p(blau|+) = 2/18
p(orange|+) = 2/18
p(grün|+) = 1/18


p(-) = 1/2
p(braun|-) = 1/18
p(schwarz|-) = 2/18
p(gelb|-) = 4/18
p(blau|-) = 3/18
p(orange|-) = 3/18
p(grün|-) = 5/18

4-b)
Klasse von w := grün,braun,orange,blau ist argmax_c ( p(grün|c)p(braun|c)p(orange|c)p(blau|c) * p(c) ).

Wahrscheinlichkeit für +: 30/(18^4 * 2)
Wahrscheinlichkeit für -: 45/(18^4 * 2)

=> Klasse c ist -

4-c)
Es wäre bspw. p(grün|+) = 0, da es kein Beispiel der Klasse + gibt in dem grün vorkommt.Gleiches gilt für p(braun|-). Für beide Klassen wäre die Wahrscheinlichkeit, dass das Wort aus 4-b der Klasse angehört, gleich 0.

4-d)
wichtig: z.B. braun, denn es trennt die Beispiele perfekt in + und -
unwichtig: z.B. gelb, denn es kommt in den Dokumenten beider Klassen gleich häufig vor, trennt die Beispiele also schlecht

STeiNy
Erstie
Erstie
Beiträge: 17
Registriert: 30. Okt 2005 09:59

Re: Lösungsvorschlag Klausur 06 Aufgabe 4

Beitrag von STeiNy » 3. Jul 2008 20:56

Hi,

4-a) d'accord, das hab ich auch so

4-b)
p(D|+) * p(+) = 1/18 * 5/18 * 2/18 * 2/18 * 1/2 = 20/18^4 * 1/2 = 10/18 <- da hast du was andres
Klassifikationsergebnis bleibt trotzdem (-)

4-c) evtl. noch das Buzzword "LaPlace"-Korrektur oder Basiswahrscheinlichkeit einbauen

4-d) hab ich auch so. Kann man wahrscheinlich noch mit log-odds-ratio kommen:
LO(T) = log(p(t|+)/p(!t|+)) - log(p(t|-)/p(!t|-))
folie wm-features.pdf (17)

gruß, und weiterhin frohes Schaffen,
Seb

Xelord
Sonntagsinformatiker
Sonntagsinformatiker
Beiträge: 225
Registriert: 23. Okt 2004 09:49

Re: Lösungsvorschlag Klausur 06 Aufgabe 4

Beitrag von Xelord » 4. Jul 2008 09:11

Jap, seh ich auch so mit den Hinweisen von STeiNy

Vladimir
Neuling
Neuling
Beiträge: 10
Registriert: 18. Apr 2010 11:43

Re: Lösungsvorschlag Klausur 06 Aufgabe 4

Beitrag von Vladimir » 19. Jul 2010 15:41

hi,

4-a)
>> p(braun|+) = 5/18

warum 18?

levitin
Kernelcompilierer
Kernelcompilierer
Beiträge: 435
Registriert: 7. Okt 2007 15:36
Wohnort: Darmstadt

Re: Lösungsvorschlag Klausur 06 Aufgabe 4

Beitrag von levitin » 19. Jul 2010 16:29

Vladimir hat geschrieben:warum 18?
Du hast wahrscheinlich Laplace Korrektur vergessen, aber statt 18 es muss eigentlich 17 stehen

Antworten

Zurück zu „Web Mining“