Bayesian Networks - Irrelevanz
Moderator: Einführung in die Künstliche Intelligenz
Bayesian Networks - Irrelevanz
Hallo,
im Foliensatz zu Bayesian Networks 2 haben wir zwei Theoreme angegeben, wann eine Zufallsvariable irrelevant ist. Folie 11 sagt, dass Y irrelevant ist, außer es ist ein Vorfahre der Zufallsvariable oder der Evidenz. Folie 14 hingegen sagt, dass Y irrelevant ist wenn es durch die Evidenz m-separated von X ist.
Wenn ich mir nun das Beispiel von Folie 14 anschaue und ein Elternknoten F von E ergänze (siehe Bild), dann widersprechen sich die Theoreme aus meiner Sicht.
Ich betrachte P(J|A) und frage mich: Ist F irrelevant? Theorem 1 sagt "Nein", da F ein Vorfahre von J bzw. A ist. Theorem 2 sagt "Ja" da ich F von J durch A m-separaten kann.
Wo ist mein Denkfehler?
Vielen Dank,
Hendrik
im Foliensatz zu Bayesian Networks 2 haben wir zwei Theoreme angegeben, wann eine Zufallsvariable irrelevant ist. Folie 11 sagt, dass Y irrelevant ist, außer es ist ein Vorfahre der Zufallsvariable oder der Evidenz. Folie 14 hingegen sagt, dass Y irrelevant ist wenn es durch die Evidenz m-separated von X ist.
Wenn ich mir nun das Beispiel von Folie 14 anschaue und ein Elternknoten F von E ergänze (siehe Bild), dann widersprechen sich die Theoreme aus meiner Sicht.
Ich betrachte P(J|A) und frage mich: Ist F irrelevant? Theorem 1 sagt "Nein", da F ein Vorfahre von J bzw. A ist. Theorem 2 sagt "Ja" da ich F von J durch A m-separaten kann.
Wo ist mein Denkfehler?
Vielen Dank,
Hendrik
-
- Neuling
- Beiträge: 7
- Registriert: 30. Apr 2015 20:54
Re: Bayesian Networks - Irrelevanz
Ich denke mal, da du P(J|A) suchst, ist durch die conditional probability per d-Separation die Unabhängigkeit von E, B, und F gegeben.
Wenn A nicht gegeben wäre, wäre J auch nicht unabhängig von F.
Wenn A nicht gegeben wäre, wäre J auch nicht unabhängig von F.
Re: Bayesian Networks - Irrelevanz
Deine Argumentation deckt sich ja mit der Schlussfolgerung von Theorem 2 der Folien. (Du redest zwar von d-separated und die Folien von m-separated, aber irgendwie sind die ja sehr ähnlich.) Allerdings bleibt dann das Problem, dass Theorem 1 aus meiner Sicht das genaue Gegenteil behauptet. Schließlich ist F sogar ein Vorfahre von J und A und damit nach Theorem 1 nicht irrelevant. Wie kann ich diese beiden unterschiedlichen Aussagen vereinen?
Re: Bayesian Networks - Irrelevanz
Ich habe es so verstanden, dass unter Vorfahren immer nur die direkte Ebene davor verstanden wird.
Also der Vorfahre von der Evidenz A ist nur E (und B) und nicht mehr, wie von dir eingezeichnet F.
Dann sagt Theorem 1 auch, dass F irrelevant ist, da für A nur B und E relevant sind, als direkte Vorfahren.
Also der Vorfahre von der Evidenz A ist nur E (und B) und nicht mehr, wie von dir eingezeichnet F.
Dann sagt Theorem 1 auch, dass F irrelevant ist, da für A nur B und E relevant sind, als direkte Vorfahren.
Re: Bayesian Networks - Irrelevanz
Ich denke das ist nur bei den parents so. Die ancestors sollten alle Vorfahren rekursiv sein, da ansonsten ja auch F bei der query P(J) irrelevant wäre (aber F ist relevant, da wir bei der query nicht die Evidenz A haben, genau wie auch E relevant ist).
Ich denke die Aussagen sind vielleicht eher als Implikationen zu lesen. Also:
- Wenn Variable keiner der Vorfahren ist => Ist irrelevant
- Wenn Variable m-separated durch die Evidenzen ist => Ist irrelevant
-
- Neuling
- Beiträge: 7
- Registriert: 30. Apr 2015 20:54
Re: Bayesian Networks - Irrelevanz
That's it. Beide Theoreme schränken die relevanten Variablen weiter ein : )
Re: Bayesian Networks - Irrelevanz
Vielen Dank für die Antworten. Noch eine letzte Frage dazu: Ist es denn mit beiden Theoremen zusammen eine Genau-dann-wenn-Beziehung? Also gilt:
"Variable ist kein Vorfahre" OR "Variable ist m-separated durch Evidenz" <==> Irrelevant
Rein mathematisch könnte es ja noch andere Fälle geben, außer denen die durch die Theoreme abgedeckt werden. Allerdings fällt mir jetzt kein gutes Gegenbeispiel dazu ein.
"Variable ist kein Vorfahre" OR "Variable ist m-separated durch Evidenz" <==> Irrelevant
Rein mathematisch könnte es ja noch andere Fälle geben, außer denen die durch die Theoreme abgedeckt werden. Allerdings fällt mir jetzt kein gutes Gegenbeispiel dazu ein.