Hallo,
Ich ein paar Fragen zu dieser Klausur. Wäre super jemand mir dabei helfen kann.
Aufgabe 1
c) Habt ihr die Antwort für die letzte Frage? (Was können Sie über die Anzahl von relevanten Dokumente...)
Aufgabe 2
2a Crawler und URL extrahieren?
2b HLRT Wrapper und titels von dem head extrahieren?
2c HLRT Wrapper mit delimeters für V# und Titel?
2d Titles können manchmal nicht komplett einstimmen --> WHIRL mit Soft queries?
2e Collaborative Filtering Memory based mit V# als 'items", Studenten als "users" und die noten als Bewertungen.
2f Collaborative Filtering Model based (co-clustering oder eigentlich clustering reicht?)
Was meint ihr dazu? wie detailliert soll man das ganze erklären?
Gruß,
Klausur SS04
Moderator: Web Mining
Re: Klausur SS04
Zu Aufgabe 1 kann man meiner Meinung nach überhaupt nicht sagen, weil die Anzahl der zurückgegebenen Dokument immer mehr als 10 größer (60 zu 80 beim ersten, 75 zu 125 beim zweiten) ist als die Menge der relevanten Dokumente. Man weiß also nicht, ob die in den ersten 10 landen oder nicht.yagami hat geschrieben:Hallo,
Ich ein paar Fragen zu dieser Klausur. Wäre super jemand mir dabei helfen kann.
Aufgabe 1
c) Habt ihr die Antwort für die letzte Frage? (Was können Sie über die Anzahl von relevanten Dokumente...)
Aufgabe 2
2a Crawler und URL extrahieren?
2b HLRT Wrapper und titels von dem head extrahieren?
2c HLRT Wrapper mit delimeters für V# und Titel?
2d Titles können manchmal nicht komplett einstimmen --> WHIRL mit Soft queries?
2e Collaborative Filtering Memory based mit V# als 'items", Studenten als "users" und die noten als Bewertungen.
2f Collaborative Filtering Model based (co-clustering oder eigentlich clustering reicht?)
Was meint ihr dazu? wie detailliert soll man das ganze erklären?
Gruß,
Re: Klausur SS04
zu Aufgabe 1 c) dritte Frage:
Suchmaschine A: P= 75/100 -> Wenn ich nun sage, ich bekomme nur 10 Dokumente zurück: 75/10 = 7,5 relevante unter diesen 10 Dokumenten
Suchmaschine B: P = 60/100 -> 60/10= 6 relevante Dok unter 10 zurückbekommenen Dokumenten
Suchmaschine A: P= 75/100 -> Wenn ich nun sage, ich bekomme nur 10 Dokumente zurück: 75/10 = 7,5 relevante unter diesen 10 Dokumenten
Suchmaschine B: P = 60/100 -> 60/10= 6 relevante Dok unter 10 zurückbekommenen Dokumenten
Re: Klausur SS04
Ja eben genau nicht, weil du keinen Rank der Ergebnisse kennst. Das Ergebnis im zweiten Fall könnte ja auch sein, dass in den 125 Antworten erstmal 50 falsche kommen und dann die 75 richtigen.muackerl hat geschrieben:zu Aufgabe 1 c) dritte Frage:
Suchmaschine A: P= 75/100 -> Wenn ich nun sage, ich bekomme nur 10 Dokumente zurück: 75/10 = 7,5 relevante unter diesen 10 Dokumenten
Suchmaschine B: P = 60/100 -> 60/10= 6 relevante Dok unter 10 zurückbekommenen Dokumenten