Klausur SS04

Moderator: Web Mining

yagami
Mausschubser
Mausschubser
Beiträge: 72
Registriert: 5. Okt 2006 03:02

Klausur SS04

Beitrag von yagami »

Hallo,
Ich ein paar Fragen zu dieser Klausur. Wäre super jemand mir dabei helfen kann.
Aufgabe 1
c) Habt ihr die Antwort für die letzte Frage? (Was können Sie über die Anzahl von relevanten Dokumente...)
Aufgabe 2
2a Crawler und URL extrahieren?
2b HLRT Wrapper und titels von dem head extrahieren?
2c HLRT Wrapper mit delimeters für V# und Titel?
2d Titles können manchmal nicht komplett einstimmen --> WHIRL mit Soft queries?
2e Collaborative Filtering Memory based mit V# als 'items", Studenten als "users" und die noten als Bewertungen.
2f Collaborative Filtering Model based (co-clustering oder eigentlich clustering reicht?)
Was meint ihr dazu? wie detailliert soll man das ganze erklären?

Gruß,

sqrtsben
Windoof-User
Windoof-User
Beiträge: 33
Registriert: 17. Sep 2010 15:46

Re: Klausur SS04

Beitrag von sqrtsben »

yagami hat geschrieben:Hallo,
Ich ein paar Fragen zu dieser Klausur. Wäre super jemand mir dabei helfen kann.
Aufgabe 1
c) Habt ihr die Antwort für die letzte Frage? (Was können Sie über die Anzahl von relevanten Dokumente...)
Aufgabe 2
2a Crawler und URL extrahieren?
2b HLRT Wrapper und titels von dem head extrahieren?
2c HLRT Wrapper mit delimeters für V# und Titel?
2d Titles können manchmal nicht komplett einstimmen --> WHIRL mit Soft queries?
2e Collaborative Filtering Memory based mit V# als 'items", Studenten als "users" und die noten als Bewertungen.
2f Collaborative Filtering Model based (co-clustering oder eigentlich clustering reicht?)
Was meint ihr dazu? wie detailliert soll man das ganze erklären?

Gruß,
Zu Aufgabe 1 kann man meiner Meinung nach überhaupt nicht sagen, weil die Anzahl der zurückgegebenen Dokument immer mehr als 10 größer (60 zu 80 beim ersten, 75 zu 125 beim zweiten) ist als die Menge der relevanten Dokumente. Man weiß also nicht, ob die in den ersten 10 landen oder nicht.

muackerl
Neuling
Neuling
Beiträge: 6
Registriert: 15. Jul 2012 22:20

Re: Klausur SS04

Beitrag von muackerl »

zu Aufgabe 1 c) dritte Frage:

Suchmaschine A: P= 75/100 -> Wenn ich nun sage, ich bekomme nur 10 Dokumente zurück: 75/10 = 7,5 relevante unter diesen 10 Dokumenten
Suchmaschine B: P = 60/100 -> 60/10= 6 relevante Dok unter 10 zurückbekommenen Dokumenten

sqrtsben
Windoof-User
Windoof-User
Beiträge: 33
Registriert: 17. Sep 2010 15:46

Re: Klausur SS04

Beitrag von sqrtsben »

muackerl hat geschrieben:zu Aufgabe 1 c) dritte Frage:

Suchmaschine A: P= 75/100 -> Wenn ich nun sage, ich bekomme nur 10 Dokumente zurück: 75/10 = 7,5 relevante unter diesen 10 Dokumenten
Suchmaschine B: P = 60/100 -> 60/10= 6 relevante Dok unter 10 zurückbekommenen Dokumenten
Ja eben genau nicht, weil du keinen Rank der Ergebnisse kennst. Das Ergebnis im zweiten Fall könnte ja auch sein, dass in den 125 Antworten erstmal 50 falsche kommen und dann die 75 richtigen.

Antworten

Zurück zu „Web Mining“