Odds Ratio: Definition, Berechnung & Interpretation
Die Odds Ratio (OR) ist das Chancenverhältnis zweier Gruppen und ein zentrales Effektmaß in Fall-Kontroll-Studien und logistischer Regression. Definition, Formel, Interpretation, Beispiele in SPSS und R.
Definition
Die Odds Ratio (OR) — auf Deutsch Chancenverhältnis oder Odds-Verhältnis — ist ein Effektmaß, das die Odds (Chancen) für ein Ereignis zwischen zwei Gruppen vergleicht. Sie ist das zentrale Maß in Fall-Kontroll-Studien und der logistischen Regression, da sie auch dann gültig berechnet werden kann, wenn die absolute Ereignishäufigkeit in der Studienpopulation nicht bekannt ist.
Die Odds einer Gruppe sind das Verhältnis von Ereignis zu Nicht-Ereignis: Wenn 20 von 100 Patienten erkranken, sind die Odds 20/80 = 0,25. Die Odds Ratio setzt nun die Odds zweier Gruppen ins Verhältnis.
Merke: Odds Ratio ≠ Relatives Risiko. Bei seltenen Ereignissen (Inzidenz < 10 %) sind beide Maße ähnlich, bei häufigen Ereignissen weichen sie systematisch voneinander ab — die OR überschätzt dann den Effekt im Vergleich zum Relativen Risiko.
Formel
Aus einer Vierfeldertafel mit den Zellen a, b, c, d:
| Ereignis (+) | kein Ereignis (−) | |
|---|---|---|
| Exposition (+) | a | b |
| Exposition (−) | c | d |
berechnet sich die Odds Ratio als:
$$OR = \frac{a \cdot d}{b \cdot c}$$
Das 95%-Konfidenzintervall wird über die logarithmierte OR berechnet (da ln(OR) annähernd normalverteilt ist):
$$\text{SE}(\ln OR) = \sqrt{\frac{1}{a} + \frac{1}{b} + \frac{1}{c} + \frac{1}{d}}$$
$$95%\text{-KI} = \exp\left(\ln OR \pm 1{,}96 \cdot \text{SE}(\ln OR)\right)$$
In der logistischen Regression ergibt sich die OR direkt aus dem Regressionskoeffizienten β: $OR = e^{\beta}$.
Voraussetzungen
Damit die Odds Ratio sinnvoll interpretierbar ist:
- Binäre Zielvariable — Ereignis ja/nein (z.B. erkrankt/gesund, exponiert/nicht-exponiert)
- Zwei vergleichbare Gruppen — z.B. Fälle vs. Kontrollen, behandelt vs. unbehandelt
- Ausreichende Zellbesetzung — alle vier Zellen der Vierfeldertafel sollten ≥ 5 sein; bei kleineren Zellen ist Fishers exakter Test statt χ² zu verwenden
- Unabhängige Beobachtungen — bei gepaarten Daten (z.B. Matched-Pairs-Design) ist die McNemar-OR zu berechnen
- Keine Nullzellen — bei a, b, c oder d = 0 wird klassisch eine Stetigkeitskorrektur (+ 0,5 zu jeder Zelle) angewandt (Haldane-Anscombe)
Interpretation
Die OR vergleicht die Chance des Ereignisses zwischen zwei Gruppen:
| OR-Wert | Interpretation |
|---|---|
| OR = 1 | Kein Unterschied — Exposition ohne Einfluss |
| OR > 1 | Erhöhte Chance in der Expositionsgruppe (Risikofaktor) |
| OR < 1 | Verminderte Chance in der Expositionsgruppe (protektiver Faktor) |
| OR = 2 | Doppelt so hohe Odds bei Exposition |
| OR = 0,5 | Halbierte Odds bei Exposition |
Statistische Signifikanz: Wenn das 95%-Konfidenzintervall die 1 nicht enthält, ist die OR statistisch signifikant (p < 0,05).
Praxis-Tipp: Berichte die OR immer mit 95%-Konfidenzintervall. Eine OR = 3,2 ohne KI ist wertlos — das KI [1,8; 5,7] sagt etwas anderes aus als [0,9; 11,3].
Klinisches Anwendungsbeispiel
Studie: Fall-Kontroll-Studie zum Zusammenhang zwischen Rauchen und oraler Plattenepithelkarzinom-Diagnose (n = 400).
| Karzinom (+) | kein Karzinom (−) | Σ | |
|---|---|---|---|
| Raucher | 120 (a) | 60 (b) | 180 |
| Nichtraucher | 30 (c) | 190 (d) | 220 |
| Σ | 150 | 250 | 400 |
Berechnung:
$$OR = \frac{a \cdot d}{b \cdot c} = \frac{120 \cdot 190}{60 \cdot 30} = \frac{22,800}{1,800} = 12{,}67$$
SE und KI:
$$\text{SE}(\ln OR) = \sqrt{\tfrac{1}{120} + \tfrac{1}{60} + \tfrac{1}{30} + \tfrac{1}{190}} = 0{,}243$$
$$95%\text{-KI} = \exp(\ln 12{,}67 \pm 1{,}96 \cdot 0{,}243) = [7{,}87;\ 20{,}40]$$
Interpretation: Die Odds, ein orales Plattenepithelkarzinom zu haben, sind bei Rauchern etwa 12,7-mal höher als bei Nichtrauchern (95%-KI: 7,9–20,4). Da das KI die 1 nicht einschließt, ist der Zusammenhang statistisch hoch signifikant. Rauchen ist in dieser Studie ein massiver Risikofaktor.
Wichtig: Die OR ist kein Kausalitätsbeweis. Confounder (Alkohol, HPV, Mundhygiene) müssen über eine logistische Regression adjustiert werden.
In SPSS berechnen
Variante 1: Kreuztabelle
Analysieren → Deskriptive Statistiken → Kreuztabellen
- Zeilen: Expositionsvariable
- Spalten: Zielvariable
- Button Statistiken → Häkchen bei Risiko
Im Output erscheint die Tabelle "Risikoschätzer" mit:
- Odds Ratio für Exposition
- 95%-Konfidenzintervall (untere/obere Grenze)
- Zusätzlich: Relatives Risiko für beide Gruppen
Variante 2: Logistische Regression
Analysieren → Regression → Binär logistisch
Im Output liefert die Spalte Exp(B) die adjustierte OR pro Prädiktor, mit zugehörigem 95%-KI. Diese Variante ist die Standardmethode für multivariate Adjustierung in der medizinischen Forschung — siehe auch unsere SPSS-Anleitung.
In R berechnen
# Vierfeldertafel anlegen
tab <- matrix(c(120, 60, 30, 190), nrow = 2, byrow = TRUE,
dimnames = list(Exposition = c("Raucher", "Nichtraucher"),
Karzinom = c("ja", "nein")))
# Variante 1: epitools-Paket
library(epitools)
oddsratio(tab, method = "wald")
# OR lower upper p-value
# 12.67 7.87 20.40 < 0.001
# Variante 2: fisher.test() liefert OR mit exaktem KI
fisher.test(tab)
# odds ratio: 12.55 (KI leicht unterschiedlich, da exakt)
# Variante 3: Logistische Regression (für Adjustierung)
model <- glm(karzinom ~ rauchen + alter + alkohol,
data = df, family = binomial)
exp(cbind(OR = coef(model), confint(model)))
Die logistische Regression ist die Methode der Wahl, sobald mehrere Prädiktoren oder Confounder berücksichtigt werden müssen. Mehr in unserer R-Statistik-Anleitung.
Häufige Fehler
Fehler 1: OR als Relatives Risiko interpretieren
Falsch: "Raucher haben ein 12,7-fach höheres Risiko." Richtig: "Raucher haben 12,7-fach höhere Odds."
Bei seltenen Ereignissen (< 10 %) ist die Näherung OR ≈ RR akzeptabel. Bei häufigen Ereignissen weicht sie deutlich ab und überschätzt den Effekt.
Fehler 2: OR ohne Konfidenzintervall berichten
Eine punktuelle OR ohne KI ist nicht publikationsfähig. Reviewer fordern stets OR + 95%-KI + p-Wert.
Fehler 3: Vertauschung der Referenzkategorie
Wird die Referenz vertauscht (Nichtraucher vs. Raucher statt umgekehrt), ergibt sich der Kehrwert: OR = 1/12,67 = 0,079. Inhaltlich gleich, aber Lesende müssen wissen, welche Gruppe Referenz ist.
Fehler 4: Ignorieren von Confoundern
Eine rohe (unadjustierte) OR aus der Kreuztabelle kann durch Drittvariablen verzerrt sein (z.B. Alter, Geschlecht). Für valide Schlüsse: adjustierte OR aus logistischer Regression.
Fehler 5: Nullzellen ignorieren
Bei a, b, c oder d = 0 ist die OR rechnerisch 0 oder ∞. Lösung: Haldane-Anscombe-Korrektur (+ 0,5 in alle vier Zellen) oder direkt Fishers exakter Test verwenden.
Fehler 6: OR als Wahrscheinlichkeit fehldeuten
OR = 3 bedeutet nicht "3-fache Wahrscheinlichkeit". Odds ≠ Wahrscheinlichkeit. Eine Wahrscheinlichkeit von 0,75 entspricht Odds von 3 (75/25), aber Odds von 3 sind keine Wahrscheinlichkeit von 3.
Verwandte Konzepte
- Relatives Risiko (RR) — alternatives Effektmaß, in Kohortenstudien bevorzugt
- Logistische Regression — multivariate Methode zur adjustierten OR-Schätzung
- Fall-Kontroll-Studie — Standard-Studientyp, in dem die OR berechnet wird (RR ist hier nicht möglich)
- Konfidenzintervall — gibt Präzision der OR an; muss stets mitberichtet werden
- Chi-Quadrat-Test — prüft Signifikanz der Assoziation in der Vierfeldertafel
- Fishers exakter Test — Alternative bei kleinen Zellbesetzungen
Häufige Fragen
- „Was ist der Unterschied zwischen Odds Ratio und Relativem Risiko?" → Das Relative Risiko (RR) vergleicht Wahrscheinlichkeiten (Inzidenzen) zweier Gruppen, die Odds Ratio vergleicht Odds (Chancen). Bei seltenen Ereignissen (< 10 %) sind beide Maße ähnlich; bei häufigen Ereignissen überschätzt die OR systematisch den Effekt im Vergleich zum RR. Das RR ist intuitiver, aber nur in Kohortenstudien direkt berechenbar — in Fall-Kontroll-Studien ist die OR die einzige Option.
- „Wann verwende ich OR und wann RR?" → OR wird in Fall-Kontroll-Studien und logistischer Regression verwendet (zwingend, da Inzidenzen nicht bekannt sind). RR ist in Kohortenstudien und randomisierten kontrollierten Studien zu bevorzugen, da es direkt interpretierbar ist. In Querschnittsstudien wird häufig die Prävalenz-OR berichtet.
- „Wie interpretiere ich eine OR von 0,5?" → Die Odds des Ereignisses sind in der Expositionsgruppe halb so hoch wie in der Referenzgruppe — die Exposition wirkt protektiv. Beispiel: OR = 0,5 für eine Impfung bedeutet halbierte Erkrankungs-Odds bei Geimpften. Auch hier gilt: 95%-KI muss mitberichtet werden, und die Aussage gilt für Odds, nicht für Wahrscheinlichkeiten.
- „Was bedeutet ein 95%-KI, das die 1 enthält?" → Wenn das 95%-Konfidenzintervall der OR die 1 einschließt (z.B. KI [0,8; 2,3]), ist der Effekt nicht statistisch signifikant — der p-Wert ist ≥ 0,05. Es kann sein, dass tatsächlich kein Effekt vorliegt oder die Stichprobe zu klein war (mangelnde Power). Konfidenzintervalle siehe auch Konfidenzintervall.
- „Wie berechne ich die OR bei mehreren Confoundern?" → Über die binär-logistische Regression. Jeder Prädiktor liefert eine adjustierte OR (Exp(B) in SPSS, exp(coef) in R), die unter Konstanthaltung der anderen Variablen den Effekt isoliert schätzt. Das ist die Standardmethode in epidemiologischen Publikationen. Mindestens 10 Ereignisse pro Prädiktor (Rule of Ten) sollten vorhanden sein.
- „Was tue ich bei einer Nullzelle in der Vierfeldertafel?" → Bei a, b, c oder d = 0 ist die OR rechnerisch 0 oder unendlich. Etablierte Lösungen: (1) Haldane-Anscombe-Korrektur — addiere 0,5 zu allen vier Zellen vor Berechnung; (2) verwende Fishers exakten Test, der auch bei Nullzellen valide p-Werte und (in R) ein exaktes KI liefert.
- „Wie wird die OR in einer Publikation berichtet?" → Standardformat: "OR = 12,67 (95%-KI: 7,87–20,40; p < 0,001)". Bei adjustierten Modellen wird zwischen roher OR (cOR) und adjustierter OR (aOR) unterschieden. Die berücksichtigten Adjustierungsvariablen müssen explizit genannt werden (z.B. "adjustiert für Alter, Geschlecht, Alkoholkonsum").
- „Kann die OR negativ sein?" → Nein. Die Odds Ratio ist ein Verhältnis und stets ≥ 0. Werte zwischen 0 und 1 zeigen einen protektiven Effekt, Werte > 1 einen Risikoeffekt, OR = 1 keinen Effekt. Negative Werte können nur beim logarithmierten ln(OR) auftreten — dieser ist in der Regressionsausgabe der Koeffizient β.
- „Warum ist die OR in Fall-Kontroll-Studien unverzichtbar?" → In Fall-Kontroll-Studien wird gezielt nach Erkrankungsstatus stratifiziert rekrutiert — die Inzidenz in der Allgemeinbevölkerung ist unbekannt. Daher kann das Relative Risiko nicht berechnet werden. Die OR ist hingegen invariant gegen die Sampling-Strategie (Symmetrie-Eigenschaft) und liefert auch in diesem Design valide Effektschätzungen. Mehr zur Studienplanung: Statistik in der Doktorarbeit.
- „Wie hängt die OR mit dem Satz von Bayes zusammen?" → Über das Verhältnis von Likelihoods: Die OR kann als Verhältnis zweier Likelihood-Quotienten interpretiert werden und spielt eine Rolle bei der Aktualisierung von Vortest- zu Nachtest-Wahrscheinlichkeiten in der diagnostischen Medizin. Vertiefung im Beitrag Satz von Bayes.