Association Rules - Support & Confidence

Moderator: Web Mining

Azazel
Windoof-User
Windoof-User
Beiträge: 30
Registriert: 26. Apr 2017 19:10

Association Rules - Support & Confidence

Beitrag von Azazel »

Hallo,

Meine Frage bezieht sich auf die angegebenen Formeln für Support und Confidence auf Folie 28 des letzten Kapitels "Web Usage Mining".

Hier heisst es, dass der Support die relative Häufigkeit von Beispielen ist, die sowohl Head als auch Body der Association Rule erfüllen. Weiterhin ist die Confidence die relative Häufigkeit der Beispiele für die den Head erfüllen unter denen, für die der Body true ist.

Mir ist unklar, was genau Head und Body einer Regel sind. Weiterhin passen die auf der Folie angegebenen Formeln nicht zu den Aussagen, die dazu getroffen werden. "Sowohl Head als auch Body [...] erfüllen" klingt für mich eher nach Schnittmenge statt Vereinigung (A UND B, statt A ODER B, wie in der Formel).

Meine Fragen also: Was genau sind Head und Body und sind die angegebenen Formeln korrekt?

Vielen Dank!

eneldo
Sonntagsinformatiker
Sonntagsinformatiker
Beiträge: 220
Registriert: 19. Mai 2006 13:06
Kontaktdaten:

Re: Association Rules - Support & Confidence

Beitrag von eneldo »

Für eine Assoziatoinsregeln gilt die Begrifflichkeit Body -> Head. In der Aussagenlogik würde man dazu auch Antezedens und Konsequenz sagen.

n(A u B) bezieht sich in der Formel auf die Anzahl aller Kunden, die (wenigstens) de Menge Produkte A u B gekauft haben. Würden wir A und B als logische Literale verstehen, also als Bedingungen "hat x gekauft", dann würde man n(A AND B) schreiben.

Gruß
Eneldo

Azazel
Windoof-User
Windoof-User
Beiträge: 30
Registriert: 26. Apr 2017 19:10

Re: Association Rules - Support & Confidence

Beitrag von Azazel »

Hallo Eneldo,

ich kann leider aus deiner Antwort immernoch nicht schließen, wofür "n(A u B)" nun steht. Vielleicht hilft mir deine Antwort auf dieses Beispiel:

Wenn folgendes gilt:
- A = {Shampoo, Conditioner}
- B = {Haarbürste}
- 3 Kunden haben Shampoo, Conditioner und eine Haarbürste gekauft
- 4 Kunden haben lediglich Shampoo und Conditioner gekauft
- 5 Kunden haben lediglich Haarbürsten gekauft

Ist n(A u B) dann 3 oder 12?

eneldo
Sonntagsinformatiker
Sonntagsinformatiker
Beiträge: 220
Registriert: 19. Mai 2006 13:06
Kontaktdaten:

Re: Association Rules - Support & Confidence

Beitrag von eneldo »

Gutes Beispiel. A u B ist dann {Shampoo, Conditioner, Haarbürste}, demnach ist n(A u B)=3 = #Kunden, die alle drei Items gekauft haben.

Gruß

Azazel
Windoof-User
Windoof-User
Beiträge: 30
Registriert: 26. Apr 2017 19:10

Re: Association Rules - Support & Confidence

Beitrag von Azazel »

Hallo eneldo,

Danke für die schnelle Antwort. Damit weiss ich immerhin schonmal, dass mein Verständnis richtig ist.

Mich verwirrt allerdings immernoch die Notation. In der Mathematik beschreibt (A u B) doch die Vereinigung der beiden Mengenbereiche. Darunter fallen demnach Kunden, die entweder A, B oder auch beides gekauft haben.

Wenn wir nun ausschließlich die Kunden haben wollen, die sowohl A als auch B gekauft haben, handelt es sich doch um die Schnittmenge (A n B), oder nicht?

eneldo
Sonntagsinformatiker
Sonntagsinformatiker
Beiträge: 220
Registriert: 19. Mai 2006 13:06
Kontaktdaten:

Re: Association Rules - Support & Confidence

Beitrag von eneldo »

Wie in Deinem Beispiel auch so verwendet, bezeichnen A, B usw. Mengen von Items, nicht von Kunden. Erst die Funktion n(X) bestimmt die Kunden. Wenn man es so machen wollte wie Du das willst, dann bräuchte man eine Hilfsfunktion k(X), die mir die Kunden zurückgibt, die alle Items in X gekauft haben. Dann ist n(A u B)= | k(A) n k(B) |.

Gruß
Eneldo

Benutzeravatar
vkuhn
Neuling
Neuling
Beiträge: 6
Registriert: 25. Okt 2015 17:20

Re: Association Rules - Support & Confidence

Beitrag von vkuhn »

Sorry für die etwas späte Antwort, aber vielleicht kannst du es dir damit ja erklären:

(A n B) wäre in deinem Beispiel ja ({Shampoo, Conditioner} n {Haarbürste}) = {}
=> n(A n B) = n{} = Anzahl der Leute, die gar nichts gekauft haben.

Andererseits ist
(A u B) = {Shampoo, Conditioner, Haarbürste} und
n(A u B) = n{Shampoo, Conditioner, Haarbürste} = Anzahl der Leute, die diese 3 Items gekauft haben.

Viel Erfolg!

Antworten

Zurück zu „Web Mining“