Bei der Bearbeitung der Aufgaben sind uns folgende Fragen gekommen. Es wäre gut, wenn ihr dazu mal eure Lösungsansätze posten könntet. Vielen Dank!
Aufgabe 4b: besitzt eine SVM eine Ähnlichkeitsfunktion? Und wie würde diese aussehen?
Aufgabe 5b: Kann man jetzt Hubs & Authorities verwenden? (wurde ohne Abschluss kontrovers diskutiert)
Aufgabe 5d: Wie viele Klassifikatoren sollen hier verwendet werden? (Es gab Argumente für 3, oder 1 Klassifikator)
Gruß,
Seb
Fragen zur Klausur SS 2004
Moderator: Web Mining
Re: Fragen zur Klausur SS 2004
Aufgabe 5b: Laut meinem Verständnis ist es einsetzbar. Wurde sogar bereits eingesetzt, aber es ist zu langsam im Vergleich zum PageRank-Verfahren und deswegen gibt es gar kein (wenige) Suchmaschinen, die das einsetzen. Die Echtzeitberechnung der Hubs/Authorityscores ist eben das Problem.
Re: Fragen zur Klausur SS 2004
Xelord hat geschrieben:Aufgabe 5b: Laut meinem Verständnis ist es einsetzbar. Wurde sogar bereits eingesetzt, aber es ist zu langsam im Vergleich zum PageRank-Verfahren und deswegen gibt es gar kein (wenige) Suchmaschinen, die das einsetzen. Die Echtzeitberechnung der Hubs/Authorityscores ist eben das Problem.
die frage ist ja, ob es sich für den *praktischen* einsatz eignet .. da es doch arg langsam ist, sollte die antwort tendenziell eher nein sein.
Drei Menschen können ein Geheimnis bewahren, wenn zwei von ihnen tot sind. - Benjamin Franklin
Re: Fragen zur Klausur SS 2004
4b: IMO ja, bei der Maximierung der BegrenzungSTeiNy hat geschrieben:Aufgabe 4b: besitzt eine SVM eine Ähnlichkeitsfunktion? Und wie würde diese aussehen?
Aufgabe 5b: Kann man jetzt Hubs & Authorities verwenden? (wurde ohne Abschluss kontrovers diskutiert)
Aufgabe 5d: Wie viele Klassifikatoren sollen hier verwendet werden? (Es gab Argumente für 3, oder 1 Klassifikator)
5b: sehe ich wie Smiling3 also IMO nein, weil einfach zu teuer
5d: Ich schlage 2 Klassifiziere vor, einen für die Trainingsbeispiele und einen für das aktuelle Dokument.
'Studenten? Ja, du weißt schon. Diese dünnen Leute, meist sehr blaß. Immerhin ist dies eine Universität. Die Studenten gehören dazu, wie Ratten...' Terry Pratchett -Voll im Bilde-
Re: Fragen zur Klausur SS 2004
4b: ich sehe bei einer SVM keine Ähnlichkeitsfuktion.Farnus hat geschrieben:4b: IMO ja, bei der Maximierung der BegrenzungSTeiNy hat geschrieben:Aufgabe 4b: besitzt eine SVM eine Ähnlichkeitsfunktion? Und wie würde diese aussehen?
Aufgabe 5b: Kann man jetzt Hubs & Authorities verwenden? (wurde ohne Abschluss kontrovers diskutiert)
Aufgabe 5d: Wie viele Klassifikatoren sollen hier verwendet werden? (Es gab Argumente für 3, oder 1 Klassifikator)
5b: sehe ich wie Smiling3 also IMO nein, weil einfach zu teuer
5d: Ich schlage 2 Klassifiziere vor, einen für die Trainingsbeispiele und einen für das aktuelle Dokument.
5d: Warum 2 Klassifizierer? Du willst einen trainieren und den untrainierten zum Testen benutzen??? Also ich würde sage, ein Klassifizierer wird benutzt.
Re: Fragen zur Klausur SS 2004
Ähnlichkeitsfunktion in SVM, wüsste ich auch nicht, wo die sein soll.
1 Klassifizierer sollte IMO ausreichen.
1 Klassifizierer sollte IMO ausreichen.
Re: Fragen zur Klausur SS 2004
Hätte da eine Frage zur Aufgabe 2.
2-e und 2-f gehen ja darum Studenten zu "helfen" passende Vorlesungen zu finden.
In 2-f wird ja gefragt welche Technik man benutzten könnte und ich hab mir einfach k-means Clustering gedacht. Aber wie kann ich dabei noch die Note des Studenten berücksichtigen ?
Oder ist in dieser Aufgabe eine andere Technik gefragt ?
Und wenn ja welche würdet Ihr benutzen ?
2-e und 2-f gehen ja darum Studenten zu "helfen" passende Vorlesungen zu finden.
In 2-f wird ja gefragt welche Technik man benutzten könnte und ich hab mir einfach k-means Clustering gedacht. Aber wie kann ich dabei noch die Note des Studenten berücksichtigen ?
Oder ist in dieser Aufgabe eine andere Technik gefragt ?
Und wenn ja welche würdet Ihr benutzen ?
Re: Fragen zur Klausur SS 2004
ich würde hier Collaborative Filtering einsetzten, und zwar in 2-e memory based und in 2-f model basedWerwolf hat geschrieben:2-e und 2-f gehen ja darum Studenten zu "helfen" passende Vorlesungen zu finden.
In 2-f wird ja gefragt welche Technik man benutzten könnte und ich hab mir einfach k-means Clustering gedacht. Aber wie kann ich dabei noch die Note des Studenten berücksichtigen ?
Oder ist in dieser Aufgabe eine andere Technik gefragt ?
Und wenn ja welche würdet Ihr benutzen ?
2-e) Memory Based Collaborative Filtering
Matrix: Studenten / Lernveralstaltungen. Einträge sind die Noten.
ua = aktiver user;
empfohleneVeranstaltungen = null;
for(i : alleVeralstaltungen){
1)add to empfohleneVeranstaltungen die geschätzte Wahrscheinlichkeitsnote, mit welcher Ua die Veranstaltung i abschließen würde.
2)m(u) unbedingt betrachten
}
empfohleneLernveranstaltungen nach der geschätzten Note sortieren und dem aktiven User empfehlen.
2-f) Model Based Collaborative Filtering mit Users-Clustering