Lösungsvorschlag Klausur 05 Aufgabe 1

Moderator: Web Mining

sYsChOs
Windoof-User
Windoof-User
Beiträge: 28
Registriert: 9. Aug 2005 12:15

Lösungsvorschlag Klausur 05 Aufgabe 1

Beitrag von sYsChOs »

Hi,

meine Vorschläge:

1-a)
a = 10, b = 20, c = 2, d = 968
recall = a/(a+c) = 10/12
precision = a/(a+b) = 10/30

precision für recall=0,5
recall = a/(a+c) = 0,5 und a+c = 12 => a=c=6

6. relevantes Dokument ist 10. Dokument des Resultates
precision=6/10

1-b)
accuracy = (a+d)/|D| = 978/1000

1-c)
Gebe keine Dokumente zurück, also a=b=0, c=12, d=988
=> accuracy = (a+d)/|D| = 988/1000 = 98,8%

1-d)
F-measure, average precision

mherrmann
Mausschubser
Mausschubser
Beiträge: 49
Registriert: 12. Nov 2005 10:10

Re: Lösungsvorschlag Klausur 05 Aufgabe 1

Beitrag von mherrmann »

Hi,

zur a)
Einverstanden.

zur b)
Einverstanden.

zur c)
Einverstanden.

zur d)
Klingt gut. Wäre denn der Recall-Precision Break-Even Point auch ein Maß? Ich denke schon.

Xelord
Sonntagsinformatiker
Sonntagsinformatiker
Beiträge: 225
Registriert: 23. Okt 2004 09:49

Re: Lösungsvorschlag Klausur 05 Aufgabe 1

Beitrag von Xelord »

Jup einverstanden.
Und ja BreakEven Point ist ein Maß

Werwolf
Windoof-User
Windoof-User
Beiträge: 39
Registriert: 10. Sep 2004 10:25

Re: Lösungsvorschlag Klausur 05 Aufgabe 1

Beitrag von Werwolf »

sYsChOs hat geschrieben: precision für recall=0,5
recall = a/(a+c) = 0,5 und a+c = 12 => a=c=6

6. relevantes Dokument ist 10. Dokument des Resultates
precision=6/10

Muss da nicht die precision 6/30 also 1/5 sein.
Denn es werden 6 relevante Dokumente zurückgegeben und 24 nicht relevante. somit wäre die precision dann 6 / (6+24).

Xelord
Sonntagsinformatiker
Sonntagsinformatiker
Beiträge: 225
Registriert: 23. Okt 2004 09:49

Re: Lösungsvorschlag Klausur 05 Aufgabe 1

Beitrag von Xelord »

Nein, wir betrachten ja nur die ersten 10 Dokumente.

mherrmann
Mausschubser
Mausschubser
Beiträge: 49
Registriert: 12. Nov 2005 10:10

Re: Lösungsvorschlag Klausur 05 Aufgabe 1

Beitrag von mherrmann »

Hi,

ich denke nicht...

Du bekommst 10 Dokumente retouniert von denen 6 relevant sind.

Nach der Formel der Precision ergibt sich dann:
=> a=6, b=4
=> a/(a+b) = 6/(6+4) = 6/10 = 3/5

Viel Erfolg an alle!

levitin
Kernelcompilierer
Kernelcompilierer
Beiträge: 435
Registriert: 7. Okt 2007 15:36
Wohnort: Darmstadt

Re: Lösungsvorschlag Klausur 05 Aufgabe 1

Beitrag von levitin »

Xelord hat geschrieben:Nein, wir betrachten ja nur die ersten 10 Dokumente.
Warum?
mherrmann hat geschrieben:Du bekommst 10 Dokumente retouniert von denen 6 relevant sind.
Wie kommt ihr denn auf 10? Es ist ja nichts darüber gesagt, wieviele Dokumenten zurückgegeben werden.
Ich nehme an, dass diese Anzahl bei 30 bleibt.

Benutzeravatar
E.d.u.
Nerd
Nerd
Beiträge: 633
Registriert: 3. Feb 2004 17:01
Wohnort: Darmstadt
Kontaktdaten:

Re: Lösungsvorschlag Klausur 05 Aufgabe 1

Beitrag von E.d.u. »

levitin hat geschrieben:
Xelord hat geschrieben:Nein, wir betrachten ja nur die ersten 10 Dokumente.
Warum?
mherrmann hat geschrieben:Du bekommst 10 Dokumente retouniert von denen 6 relevant sind.
Wie kommt ihr denn auf 10? Es ist ja nichts darüber gesagt, wieviele Dokumenten zurückgegeben werden.
Ich nehme an, dass diese Anzahl bei 30 bleibt.
Ich komme auch auf 6/30. Ist das richtig oder doch 6/10 ?!

banshee
Nerd
Nerd
Beiträge: 684
Registriert: 22. Okt 2006 18:46

Re: Lösungsvorschlag Klausur 05 Aufgabe 1

Beitrag von banshee »

Ich wäre auch von 6/30 ausgegangen, weil oben drüber explizit nochmal steht: "berechnen sie ... für dieses Suchresultat". Außerdem gibt die Suchmaschine das Ranking ja nicht iterativ sondern auf einmal zurück, man ist also nie an dem Punkt wo man nur die ersten 10 Dokumente der Query hat und den 0.5er Recall berechnet man ja auch über die Gesamtmenge der Dokumente.

Remake
Mausschubser
Mausschubser
Beiträge: 64
Registriert: 15. Dez 2007 10:40

Re: Lösungsvorschlag Klausur 05 Aufgabe 1

Beitrag von Remake »

wenn du 30 zurückgibst, dann ist es aber nicht mehr "dieses Suchresultat", sondern du machst alle Seiten die als + markiert sind implizit zu einem - (weil a=6 und das ist ab 10 Dokumenten schon voll). So erkläre ich mir das jetzt...

banshee
Nerd
Nerd
Beiträge: 684
Registriert: 22. Okt 2006 18:46

Re: Lösungsvorschlag Klausur 05 Aufgabe 1

Beitrag von banshee »

Ich hab nochmal darüber nachgedacht und glaube, dass du recht hast. Wenn man den 0,5er Recall berechnet, sucht man sich diesen "Slice" wo a = 6 ist und wenn man b dann nicht auch entsprechend anpasst, berechnet man den einen Wert quasi auf diesem Teilausschnitt und den anderen über die gesamte Dokumentmenge und implizit macht man dann das, was du beschrieben hast.

Antworten

Zurück zu „Web Mining“