Inferenz

Signifikanz & Wahrheit

12 Min.

Lernziele

•Sie verstehen, warum ein signifikantes Ergebnis nicht gleich ein wahres Ergebnis ist.
•Sie können PPV und FDR aus Vorwahrscheinlichkeit, α und Power ableiten.
•Sie können den Einfluss von Power und p-Hacking auf die Glaubwürdigkeit publizierter Befunde erklären.

Positiver prädiktiver Wert (PPV)

85.0 %

Anteil echter Effekte unter allen signifikanten Befunden

False Discovery Rate (FDR)

15.0 %

Anteil falsch-positiver Befunde unter allen signifikanten

True Positives

410

signifikant & H₁ wahr

False Positives

signifikant, aber H₀ wahr

False Negatives

n.s., aber H₁ wahr

True Negatives

427

n.s. & H₀ wahr

Alle 1000 Studien

Jeder Punkt entspricht einer Studie. Die Farbe zeigt ihre wahre Kategorie.

True Positive — signifikant, H₁ wahrFalse Positive — signifikant, H₀ wahrFalse Negative — n.s., H₁ wahrTrue Negative — n.s., H₀ wahr

Nur signifikante Befunde (483)

Das sind die Studien, die in der Literatur typischerweise veröffentlicht werden.

Von diesen sind410 echt positiv73 falsch positiv→ PPV = 85.0 %

Unter den gewählten Annahmen sind 85.0 % der signifikanten Befunde tatsächlich echt (PPV) – die übrigen 15.0 % sind falsch-positiv (FDR).

Formel (Ioannidis 2005): PPV = (p · Power + u · p · (1 − Power)) / (p · Power + u · p · (1 − Power) + (1 − p) · α + u · (1 − p) · (1 − α)). p = P(H₁), u = Bias-/p-Hacking-Anteil.