Statistik Interaktiv

Inferenz

Signifikanz & Wahrheit

12 Min.
Lernziele
  • Sie verstehen, warum ein signifikantes Ergebnis nicht gleich ein wahres Ergebnis ist.
  • Sie können PPV und FDR aus Vorwahrscheinlichkeit, α und Power ableiten.
  • Sie können den Einfluss von Power und p-Hacking auf die Glaubwürdigkeit publizierter Befunde erklären.
Positiver prädiktiver Wert (PPV)
85.0 %
Anteil echter Effekte unter allen signifikanten Befunden
False Discovery Rate (FDR)
15.0 %
Anteil falsch-positiver Befunde unter allen signifikanten
True Positives
410
signifikant & H₁ wahr
False Positives
73
signifikant, aber H₀ wahr
False Negatives
90
n.s., aber H₁ wahr
True Negatives
427
n.s. & H₀ wahr
Alle 1000 Studien
Jeder Punkt entspricht einer Studie. Die Farbe zeigt ihre wahre Kategorie.
Raster mit 1000 Punkten in 20 Zeilen und 50 Spalten.
True Positive — signifikant, H₁ wahrFalse Positive — signifikant, H₀ wahrFalse Negative — n.s., H₁ wahrTrue Negative — n.s., H₀ wahr
Nur signifikante Befunde (483)
Das sind die Studien, die in der Literatur typischerweise veröffentlicht werden.
Raster mit 1000 Punkten in 20 Zeilen und 50 Spalten.
Von diesen sind410 echt positiv73 falsch positiv→ PPV = 85.0 %

Unter den gewählten Annahmen sind 85.0 % der signifikanten Befunde tatsächlich echt (PPV) – die übrigen 15.0 % sind falsch-positiv (FDR).

Formel (Ioannidis 2005): PPV = (p · Power + u · p · (1 − Power)) / (p · Power + u · p · (1 − Power) + (1 − p) · α + u · (1 − p) · (1 − α)). p = P(H₁), u = Bias-/p-Hacking-Anteil.