Median: Definition, Berechnung & Interpretation
Der Median ist der zentrale Wert einer geordneten Datenreihe — robust gegen Ausreißer und Standard-Lagemaß bei schiefen Verteilungen. Definition, Berechnung, Anwendung in SPSS und R.
Definition
Der Median (auch: Zentralwert, 50. Perzentil) ist derjenige Wert einer der Größe nach geordneten Datenreihe, der die Verteilung in zwei gleich große Hälften teilt: 50 % der Beobachtungen liegen unter, 50 % über dem Median. Er gehört neben dem Mittelwert und dem Modus zu den drei klassischen Lagemaßen.
Im Gegensatz zum arithmetischen Mittelwert ist der Median robust gegenüber Ausreißern und extremen Werten. Aus diesem Grund ist er bei schiefen Verteilungen, Ordinaldaten und ausreißerbehafteten klinischen Variablen (z.B. Laborwerte, Krankenhausverweildauer) das bevorzugte Lagemaß.
Merke: Der Median ist das einzige Lagemaß, das bereits bei ordinalskalierten Daten (z.B. Likert-Skalen, Schmerzscores) zulässig ist. Der arithmetische Mittelwert setzt streng genommen ein metrisches Skalenniveau voraus.
Berechnung
Die Berechnung des Medians hängt davon ab, ob die Stichprobengröße n gerade oder ungerade ist. Zuerst werden alle Werte der Größe nach geordnet (x₍₁₎ ≤ x₍₂₎ ≤ … ≤ x₍ₙ₎):
- n ungerade: Der Median ist der mittlere Wert: $\tilde{x} = x_{((n+1)/2)}$
- n gerade: Der Median ist der Mittelwert der beiden mittleren Werte: $\tilde{x} = \frac{1}{2}(x_{(n/2)} + x_{(n/2 + 1)})$
Beispiel n = 7 (ungerade): Werte 3, 5, 7, 8, 12, 15, 22 → Median = 8 (4. Wert)
Beispiel n = 8 (gerade): Werte 3, 5, 7, 8, 12, 15, 22, 28 → Median = (8 + 12)/2 = 10
Voraussetzungen
Der Median ist ein sehr genügsames Lagemaß und kann bereits bei niedrigen Skalenniveaus berechnet werden:
- Mindestens Ordinalskala — die Daten müssen sich in eine sinnvolle Reihenfolge bringen lassen
- Eindeutige Sortierung möglich — Ties (gleiche Werte) sind unproblematisch
- Keine Verteilungsannahme notwendig — Median funktioniert auch bei stark schiefen, multimodalen oder unbekannten Verteilungen
- Auch bei zensierten Daten verwendbar (z.B. in der Überlebensanalyse: medianes Überleben)
Interpretation
Der Median wird in Publikationen typischerweise zusammen mit dem Interquartilsabstand (IQR) angegeben: Md (Q1; Q3) oder Md [Q1–Q3]. Diese Kombination ist das Pendant zu Mittelwert ± SD bei normalverteilten Daten.
| Verteilungstyp | Empfohlenes Lagemaß | Begründung |
|---|---|---|
| Symmetrisch, normalverteilt | Mittelwert ± SD | nutzt alle Information optimal |
| Rechtsschief (z.B. Laborwerte, Einkommen) | Median (IQR) | robust gegen Ausreißer |
| Linksschief | Median (IQR) | robust gegen Ausreißer |
| Ordinaldaten (z.B. NRS, VAS) | Median (IQR) | Mittelwert nicht zulässig |
| Mit starken Ausreißern | Median (IQR) | Mittelwert verzerrt |
Praxis-Tipp: Wenn Mittelwert und Median deutlich auseinanderliegen (Faustregel: > 10 % Differenz), ist die Verteilung schief — und der Median ist die korrektere Lagemaß-Wahl.
Klinisches Anwendungsbeispiel
Studie: Krankenhausverweildauer nach laparoskopischer Cholezystektomie bei n = 50 Patient:innen.
- Verweildauer: 1, 1, 2, 2, 2, 2, 3, 3, 3, …, 4, 5, 6, 28 (ein Patient mit Komplikation)
- Mittelwert: 4,2 Tage
- Median: 3,0 Tage (Q1 = 2; Q3 = 4)
Interpretation: Der Mittelwert (4,2) wird durch den einen Ausreißer (28 Tage) deutlich nach oben verzerrt und beschreibt die typische Verweildauer schlecht. Der Median von 3 Tagen mit IQR 2–4 zeigt: Die Hälfte der Patient:innen wird zwischen Tag 2 und 4 entlassen. Das ist klinisch deutlich aussagekräftiger.
In der Publikation würde man berichten: "Die mediane Verweildauer betrug 3,0 Tage (IQR 2–4)."
In SPSS berechnen
Analysieren → Deskriptive Statistiken → Häufigkeiten → Statistik… → Median ☑
Alternativ über Analysieren → Deskriptive Statistiken → Explorative Datenanalyse, das zusätzlich Quartile, IQR, Boxplots und Tests auf Normalverteilung liefert — die ausführlichere und für Publikationen empfohlene Variante.
Im Output erscheint der Median in der Tabelle "Statistiken" bzw. "Deskriptive Statistik". Eine Schritt-für-Schritt-Anleitung findest du im SCIORA-Tutorial zur SPSS-Auswertung.
In R berechnen
# Einfacher Median
median(df$verweildauer, na.rm = TRUE)
# [1] 3
# Median + Quartile gemeinsam
quantile(df$verweildauer, probs = c(0.25, 0.5, 0.75), na.rm = TRUE)
# 25% 50% 75%
# 2 3 4
# Gruppierter Median (z.B. nach Operationstechnik)
aggregate(verweildauer ~ technik, data = df, FUN = median)
# Komplette deskriptive Statistik via psych::describe
library(psych)
describe(df$verweildauer) # liefert median, mad, IQR, skew, kurtosis
Mehr zu deskriptiver Statistik und nichtparametrischen Verfahren in der R-Statistik-Anleitung.
Häufige Fehler
Fehler 1: Mittelwert bei Ordinaldaten verwenden
Bei Likert-Skalen (1 = "stimme gar nicht zu" bis 5 = "stimme voll zu") oder Numerischer Rating-Skala (NRS) für Schmerz ist der Abstand zwischen den Stufen nicht definiert äquidistant. Korrekt: Median (IQR). Details in der Likert-Skalen-Auswertung.
Fehler 2: Median bei stark schiefen Verteilungen mit ± SD kombinieren
Falsch: "Median 3,0 ± 2,1 Tage". Die Standardabweichung gehört zum Mittelwert. Zum Median gehört der IQR oder die MAD (Median Absolute Deviation).
Fehler 3: Median bei sehr kleinen Stichproben überinterpretieren
Bei n < 10 ist der Median sehr empfindlich gegen Hinzufügen einzelner Werte. In Pilotstudien sollte daher zusätzlich die komplette Datenreihe berichtet werden.
Fehler 4: Median und Mittelwert unkommentiert beide angeben
Wenn beide Werte deutlich auseinanderliegen, sollte das nicht ignoriert, sondern erklärt werden — das ist ein Hinweis auf Schiefe oder Ausreißer und wichtig für die Interpretation.
Fehler 5: Mediane zwischen Gruppen ohne Test vergleichen
Optisch unterschiedliche Mediane bedeuten nicht automatisch einen statistisch signifikanten Unterschied. Für den Gruppenvergleich verwendet man den Mann-Whitney-U-Test (zwei unabhängige Gruppen) oder den Kruskal-Wallis-Test (drei oder mehr).
Verwandte Konzepte
- Mittelwert — arithmetisches Lagemaß für symmetrische, metrische Daten
- Quartile — Q1 (25 %), Q2 (= Median, 50 %), Q3 (75 %)
- Interquartilsabstand (IQR) — Streuungsmaß, Pendant zur SD beim Median
- Mann-Whitney-U-Test — Vergleich zweier Mediane bei unabhängigen Gruppen
- Modus — häufigster Wert; einziges Lagemaß bei nominalskalierten Daten
- Boxplot — grafische Darstellung von Median, Quartilen und Ausreißern
Häufige Fragen
- „Wann verwende ich den Median statt des Mittelwerts?" → Wenn die Daten ordinalskaliert sind (z.B. Likert, NRS), wenn die Verteilung deutlich schief ist (z.B. Laborwerte, Verweildauer, Einkommen) oder wenn Ausreißer vorhanden sind. Bei symmetrischen, normalverteilten metrischen Daten ist der Mittelwert dagegen das informativere Lagemaß.
- „Was ist der Unterschied zwischen Median und Mittelwert?" → Der Mittelwert ist die Summe aller Werte geteilt durch n und reagiert empfindlich auf Ausreißer. Der Median ist der mittlere Wert der geordneten Reihe und ist robust — er ändert sich nicht, wenn ein einzelner extremer Wert hinzukommt.
- „Wie berechne ich den Median bei einer geraden Anzahl von Werten?" → Du nimmst den Mittelwert der beiden mittleren Werte. Bei n = 10 also den Mittelwert des 5. und 6. Wertes der geordneten Reihe. Bei ungerader n (z.B. n = 11) ist der Median direkt der mittlere Wert (hier: der 6.).
- „Darf ich den Median bei Likert-Skalen verwenden?" → Ja — der Median ist sogar das empfohlene Lagemaß bei Likert-Skalen, da diese ordinalskaliert sind. Der arithmetische Mittelwert wird zwar in der Praxis oft trotzdem berichtet, ist aber statistisch streng genommen nicht zulässig.
- „Was ist der Interquartilsabstand und warum gehört er zum Median?" → Der IQR (Q3 − Q1) ist die Spannweite der mittleren 50 % der Daten. Er ist das robuste Streuungsmaß zum Median, vergleichbar mit der Standardabweichung beim Mittelwert. In Publikationen wird der Median fast immer mit IQR berichtet: Md (Q1; Q3).
- „Warum zeigt SPSS bei meinem Median manchmal eine Dezimalzahl, obwohl alle Daten ganzzahlig sind?" → Bei gerader Stichprobengröße bildet SPSS den Mittelwert der beiden mittleren Werte. Wenn diese unterschiedlich sind (z.B. 3 und 4), ergibt sich 3,5 — auch wenn die Originaldaten ganzzahlig waren. Das ist korrekt.
- „Kann ich Mediane zweier Gruppen direkt vergleichen?" → Optisch ja, statistisch nicht ohne Test. Für den Vergleich zweier Mediane bei unabhängigen Gruppen verwendest du den Mann-Whitney-U-Test (auch: Wilcoxon-Rangsummentest), bei verbundenen Stichproben den Wilcoxon-Vorzeichen-Rang-Test. Details im Beitrag zum Wilcoxon- und Mann-Whitney-Test.
- „Was bedeutet 'medianes Überleben' in einer Kaplan-Meier-Analyse?" → Das medianes Überleben ist der Zeitpunkt, zu dem die Überlebensfunktion auf 50 % gefallen ist — also der Zeitpunkt, an dem die Hälfte der Patient:innen das Ereignis (z.B. Tod) erlebt hat. Es ist der robusteste und meistberichtete Lageparameter in der Onkologie und Survivalanalyse.
- „Was ist der Unterschied zwischen Median und 50. Perzentil?" → Es gibt keinen — beide Begriffe sind synonym. Der Median ist per Definition das 50. Perzentil. Genauso ist Q1 das 25. Perzentil und Q3 das 75. Perzentil.
- „Wie robust ist der Median wirklich gegen Ausreißer?" → Sehr robust. Der Median hat einen sogenannten Bruchpunkt von 50 %: Bis zur Hälfte der Daten kann durch beliebig extreme Werte ersetzt werden, ohne dass der Median ins Unendliche driftet. Beim Mittelwert reicht ein einziger extremer Wert, um ihn beliebig zu verschieben.