Residuen: Definition, Diagnostik & Interpretation

Residuen sind die Differenzen zwischen beobachteten und vorhergesagten Werten in einem Regressionsmodell. Definition, Diagnostik, Plots und Anwendung in SPSS und R.

Definition

Residuen sind die Differenzen zwischen den tatsächlich beobachteten Werten yᵢ einer abhängigen Variable und den durch ein Regressionsmodell vorhergesagten Werten ŷᵢ. Sie repräsentieren den Anteil der Variation in den Daten, den das Modell nicht erklären konnte — also den geschätzten Fehler pro Beobachtung.

Residuen sind das zentrale diagnostische Werkzeug der Regressionsanalyse: Aus ihrer Verteilung, ihrer Streuung und ihren Mustern lässt sich ablesen, ob die Modellannahmen (Linearität, Normalverteilung der Fehler, Homoskedastizität, Unabhängigkeit) erfüllt sind.

Merke: Residuen sind Schätzungen der unbeobachtbaren wahren Fehler εᵢ des statistischen Modells. Sie sind nicht identisch mit den Fehlern, sondern nur unsere bestmögliche Annäherung auf Basis der Stichprobe.

Formel

Für jede Beobachtung i gilt:

$$e_i = y_i - \hat{y}_i$$

mit:

  • yᵢ = beobachteter Wert der abhängigen Variable
  • ŷᵢ = vom Regressionsmodell vorhergesagter Wert
  • eᵢ = Residuum

In der einfachen linearen Regression mit ŷᵢ = b₀ + b₁·xᵢ wird das Residuum zu:

$$e_i = y_i - (b_0 + b_1 \cdot x_i)$$

Die Methode der kleinsten Quadrate (OLS) bestimmt die Regressionskoeffizienten so, dass die Summe der quadrierten Residuen minimal wird:

$$\sum_{i=1}^{n} e_i^2 \rightarrow \min$$

Standardisierte und studentisierte Residuen

Für die Diagnostik werden Residuen oft transformiert:

  • Standardisierte Residuen: eᵢ / s (geteilt durch Standardfehler) — Werte > |3| gelten als Ausreißer
  • Studentisierte Residuen: berücksichtigen zusätzlich die Hebelwirkung (Leverage) jeder Beobachtung — bevorzugt für Ausreißer-Identifikation

Voraussetzungen

Damit Residuen sinnvoll interpretiert werden können, muss zunächst ein Regressionsmodell angepasst sein. Für die klassische lineare Regression gelten folgende Annahmen, die über Residuen-Diagnostik geprüft werden:

  • Linearität — der wahre Zusammenhang zwischen Prädiktoren und Outcome ist linear
  • Normalverteilung der Residuen — eᵢ ~ N(0, σ²)
  • Homoskedastizität — konstante Varianz der Residuen über alle Werte von x
  • Unabhängigkeit — keine Autokorrelation (besonders relevant bei Zeitreihen)
  • Erwartungswert null — E(eᵢ) = 0

Eine Verletzung dieser Annahmen führt zu verzerrten Standardfehlern, falschen Konfidenzintervallen und unzuverlässigen p-Werten. Mehr zu Modellannahmen findest du im Beitrag Statistik in der Doktorarbeit.

Interpretation

Die zentralen diagnostischen Plots zur Residuen-Bewertung sind:

Plot Was wird geprüft Erwartung bei korrektem Modell
Residuen vs. Fitted Linearität, Homoskedastizität Zufällige Streuung um 0, kein Muster
Q-Q-Plot der Residuen Normalverteilung Punkte liegen auf der Diagonalen
Scale-Location-Plot Homoskedastizität Horizontale Linie, gleichmäßige Streuung
Residuen vs. Leverage Einflussreiche Datenpunkte Keine Punkte mit Cook's Distance > 1

Praxis-Tipp: Die vier Plots werden in R mit einem einzigen plot(model) erzeugt — sie sind das Standard-Werkzeug der Regressionsdiagnostik in jeder methodisch sauberen Doktorarbeit.

Typische Muster und ihre Bedeutung

  • Trichterförmige Residuen (Streuung wächst mit ŷ) → Heteroskedastizität → Log-Transformation oder Weighted Least Squares
  • U-förmiges Muster im Residuen-vs.-Fitted-Plot → nichtlinearer Zusammenhang → Polynomterm oder Spline
  • Q-Q-Plot mit S-Form → schwere Verteilungsenden → robuste Regression erwägen
  • Einzelne Ausreißer mit |std. Residuum| > 3 → einzeln prüfen, ob Messfehler oder echter Datenpunkt

Klinisches Anwendungsbeispiel

Studie: Lineare Regression — Vorhersage des HbA1c-Werts (mmol/mol) durch BMI bei n = 120 Patienten mit Typ-2-Diabetes.

Modell: HbA1c = 38,2 + 0,84 · BMI

Für eine konkrete Patientin:

  • BMI = 32 kg/m²
  • Vorhergesagter HbA1c: ŷ = 38,2 + 0,84 · 32 = 65,1 mmol/mol
  • Beobachteter HbA1c: y = 72 mmol/mol
  • Residuum: e = 72 − 65,1 = +6,9 mmol/mol

Interpretation: Der tatsächliche HbA1c-Wert dieser Patientin liegt 6,9 mmol/mol über dem, was das Modell allein auf Basis ihres BMI vorhersagt — andere Faktoren (Ernährung, Compliance, genetische Disposition) erklären diese Abweichung.

Diagnostik: Im Residuen-vs.-Fitted-Plot zeigt sich ein leicht trichterförmiges Muster — Patienten mit hohem HbA1c streuen stärker als jene mit niedrigem. Hinweis auf Heteroskedastizität → Wechsel auf log(HbA1c) oder Verwendung robuster Standardfehler.

In SPSS berechnen

Analysieren → Regression → Linear → Speichern → Residuen

Aktivieren:

  • Nicht standardisiert (Rohresiduen eᵢ)
  • Standardisiert (z-transformiert)
  • Studentisiert (für Ausreißerdiagnostik)
  • Cook-Distanz (Einflussdiagnostik)

Im Reiter Diagramme:

  • Y: ZRESID (standardisierte Residuen)
  • X: ZPRED (standardisierte Vorhersagewerte)
  • Histogramm und Normalverteilungsdiagramm ankreuzen

SPSS legt die Residuen als neue Spalten in der Datenmatrix ab. Eine ausführliche SPSS-Anleitung mit Screenshots gibt es im Tutorial.

In R berechnen

# Lineares Modell anpassen
model <- lm(HbA1c ~ BMI, data = df)

# Residuen extrahieren
residuen <- residuals(model)         # Rohresiduen
std_res <- rstandard(model)          # standardisiert
stud_res <- rstudent(model)          # studentisiert

# Vier Standard-Diagnostikplots auf einen Blick
par(mfrow = c(2, 2))
plot(model)

# Shapiro-Wilk-Test auf Normalverteilung der Residuen
shapiro.test(residuen)
# W = 0.987, p-value = 0.342  → keine Verletzung der Normalitätsannahme

# Breusch-Pagan-Test auf Heteroskedastizität
library(lmtest)
bptest(model)
# BP = 4.21, df = 1, p-value = 0.040  → leichte Heteroskedastizität

Mehr zu Regressionsdiagnostik in unserer R-Statistik-Anleitung.

Häufige Fehler

Fehler 1: Normalverteilung der Rohdaten statt der Residuen prüfen

Falsch: "Mein y ist nicht normalverteilt → lineare Regression nicht zulässig." Richtig: Die Annahme bezieht sich auf die Residuen, nicht auf y. Selbst bei schiefer Verteilung von y können die Residuen bei guter Modellpassung normalverteilt sein.

Fehler 2: Residuen-Plots ignorieren

Viele Doktorarbeiten berichten nur R² und p-Werte, ohne die Modellvoraussetzungen zu prüfen. Ein hohes R² bei verletzten Annahmen ist wertlos — Reviewer:innen erkennen das sofort.

Fehler 3: Ausreißer mit hohen Residuen reflexartig löschen

Ein großes Residuum bedeutet nicht automatisch einen fehlerhaften Datenpunkt. Es kann auch ein medizinisch besonders interessanter Fall sein. Erst Plausibilität prüfen, dann ggf. sensitivitätsanalytisch mit/ohne Ausreißer rechnen — nie kommentarlos entfernen.

Fehler 4: Cook's Distance ignorieren

Eine Beobachtung kann ein moderates Residuum haben, aber durch hohe Hebelwirkung das gesamte Modell stark beeinflussen. Cook's Distance > 1 (oder > 4/n) markiert einflussreiche Punkte.

Fehler 5: Heteroskedastizität übersehen

Trichterförmige Residuen werden bei großen n leicht als "okay" interpretiert. Folge: zu enge Konfidenzintervalle und falsch-positive p-Werte. Lösung: Log-Transformation, Weighted Least Squares oder robuste Standardfehler (HC3).

Verwandte Konzepte

  • Regression — Residuen sind Nebenprodukt jedes Regressionsmodells
  • Varianz — die Residualvarianz σ² ist Maß der unerklärten Streuung
  • Q-Q-Plot — grafische Prüfung der Normalverteilung der Residuen
  • Heteroskedastizität — nicht-konstante Varianz der Residuen über x
  • Normalverteilung — eine der zentralen Annahmen über die Residuen
  • — Anteil der durch das Modell erklärten Varianz, komplementär zur Residualvarianz
  • Cook's Distance — Maß für den Einfluss einzelner Beobachtungen auf das Gesamtmodell

Häufige Fragen

  • „Was ist der Unterschied zwischen Residuen und Fehlern?" → Fehler εᵢ sind die unbeobachtbaren Abweichungen vom wahren Modell der Grundgesamtheit. Residuen eᵢ sind unsere Schätzungen dieser Fehler auf Basis der Stichprobe. Da das wahre Modell nie bekannt ist, arbeiten wir in der Praxis ausschließlich mit Residuen.
  • „Müssen meine Daten normalverteilt sein, oder die Residuen?" → Die Residuen müssen annähernd normalverteilt sein, nicht die Rohdaten der abhängigen Variable. Das ist eine der häufigsten Verwechslungen in medizinischen Doktorarbeiten. Geprüft wird mit Q-Q-Plot, Histogramm der Residuen oder Shapiro-Wilk-Test.
  • „Wann ist ein Residuum ein Ausreißer?" → Standardisierte Residuen mit |z| > 3 gelten konventionell als Ausreißer. Bei studentisierten Residuen ist der gleiche Schwellenwert üblich. Wichtig: Ausreißer sollten nie automatisch entfernt, sondern auf Plausibilität geprüft und ggf. in einer Sensitivitätsanalyse mit/ohne Wert berichtet werden.
  • „Was bedeutet Homoskedastizität?" → Homoskedastizität bedeutet, dass die Varianz der Residuen über alle Werte der Prädiktoren konstant ist. Im Residuen-vs.-Fitted-Plot zeigt sich das als gleichmäßige Streuung ohne Trichter- oder Bandmuster. Die Verletzung (Heteroskedastizität) kann mit dem Breusch-Pagan-Test oder White-Test geprüft werden.
  • „Wie groß muss meine Stichprobe sein, damit die Residuen normalverteilt sind?" → Dank des zentralen Grenzwertsatzes werden die Residuen bei n > 30–50 oft hinreichend normalverteilt sein, selbst wenn die zugrundeliegenden Fehler es nicht sind. Bei kleinen Stichproben (n < 30) ist die Normalverteilungsprüfung jedoch kritisch.
  • „Was tun, wenn meine Residuen nicht normalverteilt sind?" → Optionen sind: (1) Transformation der abhängigen Variable (log, sqrt, Box-Cox), (2) Wechsel auf nichtparametrische oder robuste Regression, (3) Generalisierte lineare Modelle (GLM) mit passender Verteilungsfamilie, (4) bei großem n auf den zentralen Grenzwertsatz vertrauen, wenn die Abweichung moderat ist.
  • „Was ist der Unterschied zwischen standardisierten und studentisierten Residuen?" → Standardisierte Residuen werden durch den Standardfehler aller Residuen geteilt (gleicher Nenner für alle Punkte). Studentisierte Residuen verwenden einen leave-one-out-Ansatz und berücksichtigen die Hebelwirkung jeder Beobachtung — sie sind daher für die Ausreißerdiagnostik genauer und in moderner Software Standard.
  • „Warum sollte ich Residuen plotten, wenn mein R² hoch ist?" → R² misst nur, wie viel Varianz das Modell erklärt — nicht, ob es richtig ist. Ein hohes R² bei systematischen Mustern in den Residuen (z.B. U-Form) bedeutet, dass das Modell zwar viel erklärt, aber den Zusammenhang falsch spezifiziert hat. Residuen-Plots decken solche Modellfehler auf, R² nicht.
  • „Welche Software liefert die besten Residuen-Plots?" → R bietet mit plot(lm()) die umfassendste Standarddiagnostik (vier Plots automatisch). SPSS erfordert manuelle Plot-Konfiguration. Python (statsmodels) und Stata sind ebenfalls leistungsfähig. Für publikationsreife Diagnostik sind R und Python die beste Wahl, für reine Bachelor-/Doktorarbeiten reicht SPSS aus.
✅ Fachlich geprüft von PD Dr. Dr. Andreas Vollmer