Die Suche ergab 45 Treffer

von Sulzmann
11. Jan 2007 14:38
Forum: Archiv
Thema: [Projekt] Aufgabe 3
Antworten: 3
Zugriffe: 1209

Wenn Ihr Preprocessing machen und den Experimenter verwenden wollt, könnt Ihr die Vorverarbeitung im Explorer machen und die resultierenden Datensätze abspeichern. Anschließend könnt Ihr diese im Experimenter verwenden.
von Sulzmann
11. Jan 2007 14:35
Forum: Archiv
Thema: Use Missing Oder Nicht?
Antworten: 1
Zugriffe: 859

Das bleibt Euch überlassen, ob ihr diese Einstellung verändert oder nicht. Ihr solltet es dann aber in Eurer Ausarbeitung angeben.
von Sulzmann
11. Jan 2007 14:29
Forum: Archiv
Thema: Aufgabe 4
Antworten: 5
Zugriffe: 1356

Diese Lernverfahren sind nicht zur Behandlung von numerischen Werten vorgesehen, dieses Problem kann man auf zwei Arten lösen:

1. andere Datensätze wählen, oder
2. das Klassenattribut diskretisieren, wobei das nicht unbedingt sinnvoll ist.
von Sulzmann
9. Jan 2007 14:50
Forum: Archiv
Thema: [Projekt] Abgabeformat und Genauigkeitsmaß
Antworten: 7
Zugriffe: 1467

In der Aufgabe 3 und folgenden genügt eine 1x10 CV. Wer möchte kann aber auch die 10x10 CV durchführen.
von Sulzmann
9. Jan 2007 10:44
Forum: Archiv
Thema: [Projekt] Abgabeformat und Genauigkeitsmaß
Antworten: 7
Zugriffe: 1467

Wenn man den Weka Experimenter verwendet, kann man mehrere Datensätze und unterschiedliche Klassifizierer einstellen. Damit sollte dann auch die 10x10 CV kein Problem. Eine 10x10 CV kann durchaus länger als eine Stunde dauern.
von Sulzmann
9. Jan 2007 10:16
Forum: Archiv
Thema: [Projekt] Aufgabe 3
Antworten: 3
Zugriffe: 1209

Mit -C Zahl stellt man den confidenceFactor (The confidence factor used for pruning (smaller values incur more pruning)) von J48 ein. Dieser Wert muß angegeben werden, wenn der Baum gepruned werden soll. Setzt Du die Option "unpruned" auf "true", kannst Du den Wert des confidenceFactor entfernen (da...
von Sulzmann
8. Jan 2007 15:01
Forum: Archiv
Thema: Projekt: 10-fache 10-fold-Crossvalidation
Antworten: 4
Zugriffe: 1357

Weka verwendet einen Pseudozufallszahlengenerator (Random von Java), der abhängig von einer Zufallssaat Pseudozufallszahlen generiert. Anhand dieser Zufallszahlen werden die Daten aufgeteilt. Deswegen sind die "Werte" bei gleicher Saat immer gleich. Pseudozufallszahl (aus Wikipedia, der freien Enzyk...
von Sulzmann
8. Jan 2007 10:48
Forum: Archiv
Thema: [Projekt] Abgabeformat und Genauigkeitsmaß
Antworten: 7
Zugriffe: 1467

Als Abgabeformat akzeptieren wir folgende Dokumentformate ascii, doc/odt, pdf, etc.. Die Ergebnisse sollten als Dokument an eure E-Mail angehängt werden und nicht im Text der E-Mail stehen.

Zur CV: ich denke ihr bezieht euch auf Aufgabe 2. Hier ist eine 10x10 CV gemeint (10 Wiederholungen, 10 Folds)
von Sulzmann
3. Jan 2007 16:15
Forum: Archiv
Thema: Projekt: 10-fache 10-fold-Crossvalidation
Antworten: 4
Zugriffe: 1357

Bei einer 10x10 CV wiederholt man eine 10-fold-CV 10mal mit unterschiedlichen Aufteilungen in Folds. Anschließend werden die resultierenden Performanzwerte der 10 CVs gemittelt. Dadurch werden zufällig gute/schlechte Performanzwerte abgeschwächt und man erhält eine bessere Abschätzung der Performanz...
von Sulzmann
2. Jan 2007 15:11
Forum: Archiv
Thema: Projekt = Praktikum ?!
Antworten: 2
Zugriffe: 1176

Das Projekt ist keine Voraussetzung für das Praktikum. Die Teilnahme am Projekt erleichtert jedoch den Einstieg in das Praktikum, da man dadurch bereits mit den verwendeten Werkzeugen vertraut ist.
von Sulzmann
8. Dez 2006 09:59
Forum: Archiv
Thema: Frage zu Candidate Elimination Algorithm& FindGset &
Antworten: 13
Zugriffe: 1952

Die beiden Verfahren sind, soweit ich weiß, nicht in Weka vorhanden, aber man kann sie selbst programmieren und zu Weka hinzufügen.

Mir sind leider auch keine Tools bekannt, mit denen man diese Verfahren ausprobieren kann.
von Sulzmann
1. Dez 2006 17:14
Forum: Archiv
Thema: Frage zu Candidate Elimination Algorithm& FindGset &
Antworten: 13
Zugriffe: 1952

Die Musterlösung für diese Klausur steht im Netz.
von Sulzmann
1. Dez 2006 16:11
Forum: Archiv
Thema: Frage zu Candidate Elimination Algorithm& FindGset &
Antworten: 13
Zugriffe: 1952

FindG-Set sucht nach den generellsten Hypothesen, die konsistent auf den Daten sind. Enstprechend sucht FindS-Set nach den speziellsten Hypothesen, die konsistent auf den Daten sind. Ersterer Algorithmus neigt zu generellen Hypothesen, während der zweite eher zu spezielleren neigt. Aus diesem Grund ...
von Sulzmann
24. Nov 2006 15:07
Forum: Archiv
Thema: TDIDT & ID3
Antworten: 3
Zugriffe: 1167

Bei ID3 handelt es sich um die TDIDT mit dem Maß (Information)-Gain. TDIDT ist nur ein allgemeines Grundgerüst für verschiedene Entscheidungsbaum-Lerner.
von Sulzmann
13. Nov 2006 16:05
Forum: Archiv
Thema: Klausurtermin
Antworten: 1
Zugriffe: 1107

Der Klausur-Termin befindet sich auf der KE-Seite.

Zur erweiterten Suche