2×2
P(A|B)
P(B)

Vierfeldertafel und bedingte Wahrscheinlichkeit

Verstehe die Grundlagen der bedingten Wahrscheinlichkeit und lerne, wie man die Vierfeldertafel für statistische Auswertungen und Entscheidungen nutzt. Interaktive Beispiele helfen dir, die Konzepte praktisch anzuwenden.

Was ist eine Vierfeldertafel?

Eine Vierfeldertafel (auch Kontingenztafel genannt) ist ein wichtiges Werkzeug in der Stochastik, um Daten übersichtlich darzustellen und bedingte Wahrscheinlichkeiten zu berechnen. Sie wird besonders häufig verwendet, wenn zwei Merkmale mit jeweils zwei Ausprägungen untersucht werden.

Aufbau einer Vierfeldertafel
Merkmal B: ja (B) Merkmal B: nein (B̅) Summe
Merkmal A: ja (A) nAB nAB̅ nA
Merkmal A: nein (Ā) nĀB nĀB̅ nĀ
Summe nB n n

Dabei stehen die einzelnen Zellen für die Anzahl der Elemente, die bestimmte Merkmale erfüllen:

  • nAB: Anzahl der Elemente, die sowohl Merkmal A als auch Merkmal B haben
  • nAB̅: Anzahl der Elemente, die Merkmal A haben, aber nicht Merkmal B
  • nĀB: Anzahl der Elemente, die nicht Merkmal A, aber Merkmal B haben
  • nĀB̅: Anzahl der Elemente, die weder Merkmal A noch Merkmal B haben
  • n: Gesamtzahl aller Elemente

Beispiel: Smartphones in der Klasse

In einer Klasse mit 30 Schülerinnen und Schülern wurde untersucht, wie viele ein Smartphone besitzen und wie viele regelmäßig soziale Medien nutzen. Die Ergebnisse wurden in einer Vierfeldertafel zusammengefasst:

Nutzt soziale Medien (S) Nutzt keine sozialen Medien (S̅) Summe
Hat Smartphone (H) 20 5 25
Hat kein Smartphone (H̅) 2 3 5
Summe 22 8 30

Interpretation der Daten:

  • 20 Schüler haben ein Smartphone und nutzen soziale Medien.
  • 5 Schüler haben ein Smartphone, nutzen aber keine sozialen Medien.
  • 2 Schüler haben kein Smartphone, nutzen aber soziale Medien (z.B. am Computer).
  • 3 Schüler haben kein Smartphone und nutzen keine sozialen Medien.
  • Insgesamt haben 25 Schüler ein Smartphone.
  • Insgesamt nutzen 22 Schüler soziale Medien.

Berechnung von Wahrscheinlichkeiten

Mit Hilfe der Vierfeldertafel können verschiedene Wahrscheinlichkeiten berechnet werden.

Absolute Wahrscheinlichkeit (Randwahrscheinlichkeit)

Die Wahrscheinlichkeit, dass ein zufällig ausgewählter Schüler ein Smartphone besitzt:

\(P(H) = \frac{n_H}{n} = \frac{25}{30} = \frac{5}{6} \approx 0,833 \; (83,3\%)\)

Bedingte Wahrscheinlichkeit

Die Wahrscheinlichkeit, dass ein Schüler soziale Medien nutzt, unter der Bedingung, dass er ein Smartphone besitzt:

\(P(S|H) = \frac{n_{HS}}{n_H} = \frac{20}{25} = \frac{4}{5} = 0,8 \; (80\%)\)

Die bedingte Wahrscheinlichkeit gibt an, wie wahrscheinlich das Eintreten eines Ereignisses ist, wenn ein anderes Ereignis bereits eingetreten ist.

Verbundwahrscheinlichkeit (Schnittwahrscheinlichkeit)

Die Wahrscheinlichkeit, dass ein zufällig ausgewählter Schüler sowohl ein Smartphone besitzt als auch soziale Medien nutzt:

\(P(H \cap S) = \frac{n_{HS}}{n} = \frac{20}{30} = \frac{2}{3} \approx 0,667 \; (66,7\%)\)

Multiplikationssatz der Wahrscheinlichkeitsrechnung

Der Zusammenhang zwischen bedingter Wahrscheinlichkeit und Schnittwahrscheinlichkeit:

\(P(H \cap S) = P(H) \cdot P(S|H)\)

\(\frac{20}{30} = \frac{25}{30} \cdot \frac{20}{25}\)

\(\frac{2}{3} = \frac{5}{6} \cdot \frac{4}{5} = \frac{20}{30} = \frac{2}{3}\)

Interaktive Vierfeldertafel

Erstelle deine eigene Vierfeldertafel und berechne die Wahrscheinlichkeiten. Gib die Werte für die einzelnen Zellen ein und klicke auf "Berechnen".

Wähle ein Beispielszenario oder erstelle dein eigenes:

Vierfeldertafel Merkmal B: ja (B) Merkmal B: nein (B̅) Summe
Merkmal A: ja (A) 0 0 0
Merkmal A: nein (Ā) 0 0 0
Summe 0 0 0

Berechnete Wahrscheinlichkeiten:

Anwendungen der Vierfeldertafel

Vierfeldertafeln werden in vielen Bereichen eingesetzt:

Medizin

Untersuchung des Zusammenhangs zwischen einer Krankheit und einem Risikofaktor oder zur Bewertung von Diagnosetests.

Beispiel: Wie zuverlässig ist ein Coronavirus-Schnelltest? Richtig-positive, falsch-positive, richtig-negative und falsch-negative Ergebnisse können in einer Vierfeldertafel dargestellt werden.

Marketing

Analyse des Zusammenhangs zwischen Werbemaßnahmen und Kaufentscheidungen.

Beispiel: Wie viele Kunden, die eine Werbemail erhalten haben, haben das beworbene Produkt gekauft im Vergleich zu Kunden, die keine Werbung erhalten haben?

Bildung

Untersuchung des Zusammenhangs zwischen Lernmethoden und Prüfungserfolg.

Beispiel: Wie groß ist der Anteil der Schüler, die mit einer bestimmten Lernmethode die Prüfung bestanden haben, verglichen mit anderen Methoden?

Satzes von Bayes: Ein wichtiges Werkzeug in der Stochastik

Der Satz von Bayes ist eine wichtige Formel in der Wahrscheinlichkeitsrechnung, mit der bedingte Wahrscheinlichkeiten berechnet werden können. Mit Hilfe einer Vierfeldertafel lässt er sich besonders anschaulich darstellen.

Satz von Bayes

Für zwei Ereignisse A und B gilt:

\[P(A|B) = \frac{P(B|A) \cdot P(A)}{P(B)}\]

Mit Hilfe der Vierfeldertafel:

\[P(A|B) = \frac{n_{AB}}{n_B}\]
Beispiel: COVID-19-Schnelltest

Ein COVID-19-Schnelltest hat folgende Eigenschaften:

  • Sensitivität (Richtig-positiv-Rate): 80% - Wenn jemand infiziert ist, schlägt der Test zu 80% an.
  • Spezifität (Richtig-negativ-Rate): 98% - Wenn jemand nicht infiziert ist, zeigt der Test zu 98% kein positives Ergebnis.
  • Aktuell sind 2% der Bevölkerung infiziert.

Wie groß ist die Wahrscheinlichkeit, dass jemand tatsächlich infiziert ist, wenn der Schnelltest positiv ist?

Test positiv (T+) Test negativ(T-) Summe
Infiziert (I+) 16 4 20
Nicht infiziert(I-) 20 960 980
Summe 36 964 1000

Wir suchen \(P(I+|T+)\), also die Wahrscheinlichkeit, dass jemand infiziert ist, wenn der Test positiv ist:

\[P(I+|T+) = \frac{n_{I+,T+}}{n_{T+}} = \frac{16}{36} = \frac{4}{9} \approx 0,444 \; (44,4\%)\]

Obwohl der Test eine hohe Genauigkeit hat, ist die Wahrscheinlichkeit einer tatsächlichen Infektion bei positivem Testergebnis nur ca. 44%, wenn die Infektionsrate in der Bevölkerung gering ist (2%).