Homework 7 Task 1 b)

Moderator: Algorithms of Language Technology

Toa
BASIC-Programmierer
BASIC-Programmierer
Beiträge: 121
Registriert: 16. Feb 2011 23:58

Homework 7 Task 1 b)

Beitrag von Toa »

Hey,
ich kann mit der Aufgabe momentan überhaupt nichts anfangen. Was ist denn die "latent topic representation"? Ich vermute, das "latent vector space representation" die normale Document Term Matrix ist? Außerdem frage ich mich was die "Query document term matrix" ist. In den Folien kann ich dazu nichts finden, oder ich suche nach den falschen Schlagwörtern. Hoffe mir kann jemand helfen. Grüße T0a

riedl
Moderator
Moderator
Beiträge: 26
Registriert: 3. Apr 2013 12:25

Re: Homework 7 Task 1 b)

Beitrag von riedl »

Also die latent topic representation ist "grob" gesagt die repraesentation texten in ihrer Topic Repraesentierung (manchmal auch concept space genannt). In Aufgabe 1a sollten die trainingsdaten in der topic repraesentierung geplottet werden. In der Aufgabe 1b soll das trainierte Modell von Aufgabe1a auf die test documente angewendet werden. Anschliessend sollen diese im Topic Space (wie auch bei Aufgabe 1a)) geplottet werden und zusaetzlich die Trainingsdocumente in der gleichen repraesentierung.
Folie 10 zeigt die Formel mit der man ein gelerntes Model auf neue Dokumente anwenden kann.

Seldon
BASIC-Programmierer
BASIC-Programmierer
Beiträge: 119
Registriert: 19. Apr 2012 18:12

Re: Homework 7 Task 1 b)

Beitrag von Seldon »

Mit der latent topic representation meinst du s$v, was auch auf Folie 13 zu sehen ist, oder? Ich hatte aus Versehen Ak berechnet, was könnte man denn mit dem Bild dann anfangen? :)

riedl
Moderator
Moderator
Beiträge: 26
Registriert: 3. Apr 2013 12:25

Re: Homework 7 Task 1 b)

Beitrag von riedl »

genau mit der Konzept repraesentation der Dokumente meine ich matrix v. Im graph ist dies s$u weil ich die document word Matrix nicht transponiert habe. Ak ist ja einfach nur die Word Document Matrix. Sprich wenn du da die ersten beiden dimensionen plottest, dann plottest du die Anzahl von 2 Woertern fuer jedes Dokument.

Seldon
BASIC-Programmierer
BASIC-Programmierer
Beiträge: 119
Registriert: 19. Apr 2012 18:12

Re: Homework 7 Task 1 b)

Beitrag von Seldon »

Danke!

Antworten

Zurück zu „Algorithms of Language Technology“