Seite 1 von 1

Homework 7 Task 1 b)

Verfasst: 27. Jun 2013 19:36
von Toa
Hey,
ich kann mit der Aufgabe momentan überhaupt nichts anfangen. Was ist denn die "latent topic representation"? Ich vermute, das "latent vector space representation" die normale Document Term Matrix ist? Außerdem frage ich mich was die "Query document term matrix" ist. In den Folien kann ich dazu nichts finden, oder ich suche nach den falschen Schlagwörtern. Hoffe mir kann jemand helfen. Grüße T0a

Re: Homework 7 Task 1 b)

Verfasst: 28. Jun 2013 09:08
von riedl
Also die latent topic representation ist "grob" gesagt die repraesentation texten in ihrer Topic Repraesentierung (manchmal auch concept space genannt). In Aufgabe 1a sollten die trainingsdaten in der topic repraesentierung geplottet werden. In der Aufgabe 1b soll das trainierte Modell von Aufgabe1a auf die test documente angewendet werden. Anschliessend sollen diese im Topic Space (wie auch bei Aufgabe 1a)) geplottet werden und zusaetzlich die Trainingsdocumente in der gleichen repraesentierung.
Folie 10 zeigt die Formel mit der man ein gelerntes Model auf neue Dokumente anwenden kann.

Re: Homework 7 Task 1 b)

Verfasst: 1. Jul 2013 20:38
von Seldon
Mit der latent topic representation meinst du s$v, was auch auf Folie 13 zu sehen ist, oder? Ich hatte aus Versehen Ak berechnet, was könnte man denn mit dem Bild dann anfangen? :)

Re: Homework 7 Task 1 b)

Verfasst: 2. Jul 2013 10:54
von riedl
genau mit der Konzept repraesentation der Dokumente meine ich matrix v. Im graph ist dies s$u weil ich die document word Matrix nicht transponiert habe. Ak ist ja einfach nur die Word Document Matrix. Sprich wenn du da die ersten beiden dimensionen plottest, dann plottest du die Anzahl von 2 Woertern fuer jedes Dokument.

Re: Homework 7 Task 1 b)

Verfasst: 2. Jul 2013 16:42
von Seldon
Danke!