Vorschlag 4 von 05 ?

Moderator: Web Mining

Xelord
Sonntagsinformatiker
Sonntagsinformatiker
Beiträge: 225
Registriert: 23. Okt 2004 09:49

Vorschlag 4 von 05 ?

Beitrag von Xelord »

4 hab ich keine Ahnung, vielleicht hat jemand da ein brauchbaren Ansatz.
Zuletzt geändert von Xelord am 4. Jul 2008 09:12, insgesamt 1-mal geändert.

mherrmann
Mausschubser
Mausschubser
Beiträge: 49
Registriert: 12. Nov 2005 10:10

Re: Vorschlag 4 von 06 ?

Beitrag von mherrmann »

Spontan würde ich sagen:

a)
#bedingter Wahrscheinlichkeiten: 30.000 Features * 10 Klassen = 300.000
#unbedingte Wahrscheinlichkeiten: 10 Klassenwahrscheinlichkeiten

Macht in der Summe 300.010.
Ich lasse mich aber gerne eines besseren belehren.

b)
Schon im Forum behandelt. Stichwort: Laplace Korrektur

c)
Multinomial: Benutzt Bag-of-Words
Binomial: Benutzt Set-of-Words

d)
Teils vorklassifizierte Trainingsbeispiele.

e)
Ja... Bei allen drei Verfahren müssen sich die Klassifizierer sicher in ihren Entscheidungen sein. Oder allgemeiner, sie müssen ein Sicherheitsmaß anbieten.

Hoffe das hilft. Verbesserungen, gerne. :)

Xelord
Sonntagsinformatiker
Sonntagsinformatiker
Beiträge: 225
Registriert: 23. Okt 2004 09:49

Re: Vorschlag 4 von 06 ?

Beitrag von Xelord »

äh das ist doch die 4 aus 05 ;)

mherrmann
Mausschubser
Mausschubser
Beiträge: 49
Registriert: 12. Nov 2005 10:10

Re: Vorschlag 4 von 06 ?

Beitrag von mherrmann »

Ohje... das ist das Zeichen zum ins Bett gehen. :roll:

Und am schönsten ist ja auch noch, dass die Aufgabe schon im Forum behandelt wurde:

http://www.d120.de/forum/viewtopic.php?f=419&t=12771

Wäre nett wenn trotzdem jemand seinen Kommentar dazu abgibt. Also, SS05 Aufgabe 4 :)

Xelord
Sonntagsinformatiker
Sonntagsinformatiker
Beiträge: 225
Registriert: 23. Okt 2004 09:49

Re: Vorschlag 4 von 06 ?

Beitrag von Xelord »

Ups :oops:
Ich hab mal den Titel geändert.

Xelord
Sonntagsinformatiker
Sonntagsinformatiker
Beiträge: 225
Registriert: 23. Okt 2004 09:49

Re: Vorschlag 4 von 05 ?

Beitrag von Xelord »

4-a,4-b einverstanden.
4-c Multinomial: bag-of-words, gleiche Dokumentenlänge
binär: set-of-words, Dokumentenlänge unbeachtet
Multinomial ist generell besser als binär. binär nur bei kleinen Mengen.
4-d einverstanden.
4-e Es sind Active Learning, Co-Training und Self-Training. Sie müssen Teile sicher Klassifizieren können.

Antworten

Zurück zu „Web Mining“