Mittelwert: Definition, Berechnung & Beispiele
Der Mittelwert (arithmetisches Mittel) ist die Summe aller Messwerte geteilt durch ihre Anzahl. Definition, Formel, Berechnung in SPSS und R, klinische Beispiele und häufige Fehler.
Definition
Der Mittelwert (auch: arithmetisches Mittel, Durchschnitt, mean) ist das gebräuchlichste Lagemaß der deskriptiven Statistik. Er beschreibt das rechnerische Zentrum einer Verteilung und wird gebildet, indem man die Summe aller Beobachtungswerte durch die Anzahl der Beobachtungen teilt.
Der Mittelwert ist nur für metrische Daten (intervall- oder verhältnisskaliert) sinnvoll definiert — also für Variablen wie Blutdruck, Alter, Knochendichte oder Laborwerte. Bei ordinalen Daten (z.B. Likert-Skalen, Schmerzscores) ist seine Berechnung umstritten und sollte mit Bedacht erfolgen.
Merke: Der Mittelwert ist empfindlich gegenüber Ausreißern. Ein einzelner Extremwert kann ihn stark verzerren. Bei schiefen Verteilungen ist der Median das robustere Lagemaß.
Formel
Für eine Stichprobe mit n Beobachtungen x₁, x₂, …, xₙ:
$$\bar{x} = \frac{1}{n} \sum_{i=1}^{n} x_i = \frac{x_1 + x_2 + \dots + x_n}{n}$$
Der Populations-Mittelwert wird mit μ (mü) bezeichnet, der Stichproben-Mittelwert mit x̄ (x quer). In wissenschaftlichen Publikationen wird der Mittelwert nahezu immer zusammen mit der Standardabweichung berichtet — z.B. M = 124,5 mmHg (SD = 11,2).
Gewichteter Mittelwert
Wenn die Beobachtungen unterschiedlich gewichtet werden sollen (z.B. bei Meta-Analysen oder Stichproben unterschiedlicher Größe):
$$\bar{x}w = \frac{\sum{i=1}^{n} w_i \cdot x_i}{\sum_{i=1}^{n} w_i}$$
Voraussetzungen
Damit der Mittelwert ein aussagekräftiges Lagemaß ist, sollten folgende Bedingungen erfüllt sein:
- Metrisches Skalenniveau — Differenzen zwischen Werten müssen interpretierbar sein
- Annähernd symmetrische Verteilung — bei stark schiefen Daten verzerrt der Mittelwert das Bild
- Keine extremen Ausreißer — sonst Median oder getrimmter Mittelwert verwenden
- Homogene Population — bei multimodalen Verteilungen ist kein Lagemaß allein aussagekräftig
Praxis-Tipp: Vor der Berechnung des Mittelwerts immer ein Histogramm oder Boxplot erstellen. Der Mittelwert beschreibt eine schiefe Verteilung schlecht — das fällt in einer Tabelle nicht auf, in der Grafik sofort.
Interpretation
Der Mittelwert hat folgende Eigenschaften:
| Eigenschaft | Bedeutung |
|---|---|
| Schwerpunkt | Σ(xᵢ − x̄) = 0 — die Summe der Abweichungen vom Mittelwert ist immer null |
| Quadratische Optimalität | Σ(xᵢ − x̄)² ist minimal — kein anderer Wert hat kleinere Abweichungsquadrate |
| Linearität | Mittelwert(a·X + b) = a·Mittelwert(X) + b |
| Ausreißer-Sensitivität | Bereits ein Extremwert verschiebt den Mittelwert deutlich |
Mittelwert vs. Median
| Situation | Empfohlenes Lagemaß |
|---|---|
| Symmetrische Verteilung, keine Ausreißer | Mittelwert |
| Schiefe Verteilung (z.B. Einkommen, Wartezeiten) | Median |
| Ordinale Daten (Likert, Schmerzscore) | Median (oder Modus) |
| Stichprobe mit Extremwerten | Median oder getrimmter Mittelwert |
Klinisches Anwendungsbeispiel
Studie: Systolischer Blutdruck bei 8 Patient:innen vor einer kardiologischen Intervention (in mmHg):
118, 122, 125, 128, 130, 132, 135, 220
Berechnung Mittelwert:
$$\bar{x} = \frac{118 + 122 + 125 + 128 + 130 + 132 + 135 + 220}{8} = \frac{1110}{8} = 138{,}75 \text{ mmHg}$$
Berechnung Median: Mittelwert der zwei mittleren Werte = (128 + 130) / 2 = 129 mmHg
Interpretation: Der Mittelwert von 138,75 mmHg liegt deutlich oberhalb der Datenwolke und wird durch den Ausreißer (220 mmHg, evtl. hypertensive Krise) stark verzerrt. Der Median von 129 mmHg beschreibt das Zentrum der Daten realistischer. In dieser Situation sollte der Median berichtet werden — oder, bei Verwendung des Mittelwerts, zusammen mit dem Hinweis auf den Ausreißer.
Merke: Bei kleinem n und Verdacht auf Ausreißer immer beide Lagemaße (Mittelwert und Median) berichten und vergleichen. Eine große Differenz signalisiert Schiefe oder Ausreißer.
In SPSS berechnen
Analysieren → Deskriptive Statistiken → Deskriptive Statistik
Variable in das Feld "Variablen" verschieben → Optionen → Mittelwert und Standardabweichung anhaken → OK.
Alternativ über Analysieren → Deskriptive Statistiken → Häufigkeiten → Statistik, dort zusätzlich Median, Minimum, Maximum auswählen — empfohlen für die explorative Datenanalyse.
Im Output-Tab "Deskriptive Statistik" findest du den Mittelwert in der Spalte "Mittelwert". Eine vollständige SPSS-Anleitung findest du im Begleit-Tutorial.
In R berechnen
# Einfacher Mittelwert
blutdruck <- c(118, 122, 125, 128, 130, 132, 135, 220)
mean(blutdruck)
# [1] 138.75
# Mittelwert mit fehlenden Werten (NA)
mean(blutdruck, na.rm = TRUE)
# Getrimmter Mittelwert (10 % an jedem Rand entfernt)
mean(blutdruck, trim = 0.1)
# [1] 128.67
# Gruppenweise Mittelwerte
aggregate(blutdruck ~ gruppe, data = df, FUN = mean)
# Mittelwert + SD in einem Schritt (mit dplyr)
library(dplyr)
df %>%
group_by(gruppe) %>%
summarise(M = mean(blutdruck, na.rm = TRUE),
SD = sd(blutdruck, na.rm = TRUE),
n = n())
Mehr Details zur deskriptiven Auswertung in unserer R-Statistik-Anleitung.
Häufige Fehler
Fehler 1: Mittelwert bei stark schiefen Verteilungen
Bei Variablen wie Wartezeiten, Krankenhausaufenthaltsdauer oder Einkommen ist die Verteilung typischerweise rechtsschief. Der Mittelwert überschätzt dann das "typische" Niveau. Lösung: Median verwenden oder log-transformieren.
Fehler 2: Mittelwert bei Ordinaldaten ohne Reflexion
Likert-Skalen ("trifft voll zu" bis "trifft gar nicht zu", kodiert 1–5) sind streng genommen ordinal. Trotzdem wird in der Praxis oft der Mittelwert berichtet. Empfehlung: Bei ≥ 5 Stufen und annähernd symmetrischer Verteilung akzeptabel — bei < 5 Stufen lieber Median + Häufigkeitsverteilung. Mehr dazu in unserem Beitrag zur Likert-Skalen-Auswertung.
Fehler 3: Mittelwert ohne Streuungsmaß berichten
"Der mittlere Blutdruck war 138 mmHg" — ohne Standardabweichung, IQR oder Konfidenzintervall ist das eine wertarme Aussage. Standardformat in Publikationen: M = 138,8 mmHg (SD = 33,2) oder M = 138,8, 95%-KI [115,1; 162,5].
Fehler 4: Mittelwerte von Mittelwerten bilden
Wenn Gruppen unterschiedliche n haben, ergibt der Mittelwert der Gruppenmittelwerte nicht den Gesamtmittelwert. Korrekt: gewichteter Mittelwert mit n als Gewicht — oder Mittelwert auf Rohdatenebene berechnen.
Fehler 5: Ausreißer ungeprüft akzeptieren
Ein Wert von 220 mmHg könnte ein Messfehler, eine hypertensive Krise oder ein Übertragungsfehler sein. Vor der Mittelwertberechnung gehört eine Ausreißeranalyse (Boxplot, z-Score > 3, IQR-Regel) zur Pflicht.
Verwandte Konzepte
- Median — robusteres Lagemaß bei Schiefe und Ausreißern
- Modus — häufigster Wert; einziges Lagemaß bei Nominaldaten
- Standardabweichung — Streuung um den Mittelwert
- Normalverteilung — Verteilung, in der Mittelwert = Median = Modus gilt
- Getrimmter Mittelwert — Mittelwert nach Entfernung der Extremwerte (z.B. 10 %)
Häufige Fragen
- „Was ist der Unterschied zwischen Mittelwert und Median?" → Der Mittelwert ist die Summe aller Werte geteilt durch n, der Median ist der Wert, der die geordnete Stichprobe in zwei Hälften teilt. Der Mittelwert reagiert empfindlich auf Ausreißer, der Median nicht. Bei symmetrischen Verteilungen sind beide Werte ähnlich; bei schiefen Verteilungen unterscheiden sie sich deutlich.
- „Wann sollte ich den Mittelwert nicht berichten?" → Bei stark schiefen Verteilungen (z.B. Einkommen, Wartezeiten), bei Ausreißern, bei kleinen Stichproben mit n < 10 und bei ordinalen Daten mit wenigen Skalenstufen. In diesen Fällen ist der Median informativer.
- „Darf ich den Mittelwert bei Likert-Skalen berechnen?" → Streng genommen sind Likert-Items ordinal — der Mittelwert ist mathematisch problematisch. In der Praxis wird er trotzdem berichtet, wenn die Skala mindestens 5 Stufen hat und die Verteilung annähernd symmetrisch ist. Bei summierten Likert-Skalen (mehrere Items zu einem Score) ist der Mittelwert breit akzeptiert.
- „Was bedeutet x̄ in der Statistik?" → x̄ (gesprochen: x quer) ist das Symbol für den Stichproben-Mittelwert. Der Populations-Mittelwert wird mit dem griechischen Buchstaben μ (mü) bezeichnet. In Publikationen wird stattdessen häufig "M" verwendet.
- „Wie berechne ich den gewichteten Mittelwert?" → Jeder Wert xᵢ wird mit einem Gewicht wᵢ multipliziert; die gewichtete Summe wird durch die Summe der Gewichte geteilt: x̄_w = Σ(wᵢ·xᵢ) / Σwᵢ. Anwendung z.B. in Meta-Analysen, wo Studien mit größerer Stichprobe stärker gewichtet werden, oder bei Notenberechnungen mit Credit Points.
- „Was ist ein getrimmter Mittelwert?" → Beim getrimmten Mittelwert werden die k % kleinsten und k % größten Werte entfernt, bevor der Mittelwert berechnet wird (typisch: 5 % oder 10 %). Er ist robuster gegen Ausreißer als der einfache Mittelwert, behält aber mehr Information als der Median. In R:
mean(x, trim = 0.1). - „Warum zeigt SPSS den Mittelwert mit so vielen Nachkommastellen?" → SPSS zeigt standardmäßig 2–4 Nachkommastellen, was wissenschaftlich oft unangemessen präzise wirkt. Faustregel für Publikationen: Mittelwert auf eine Nachkommastelle mehr als die Rohdaten runden. Bei ganzzahligen Messungen (z.B. Alter) genügt eine Nachkommastelle.
- „Wie hängt der Mittelwert mit der Normalverteilung zusammen?" → In einer perfekten Normalverteilung gilt: Mittelwert = Median = Modus. Der Mittelwert markiert das Maximum der Glockenkurve und ihre Symmetrieachse. Der Zentrale Grenzwertsatz besagt zudem: Mittelwerte vieler Stichproben sind annähernd normalverteilt — selbst wenn die Ausgangsverteilung es nicht ist. Das macht den Mittelwert zur Grundlage vieler parametrischer Tests.
- „Soll ich Mittelwert oder Median in der Doktorarbeit berichten?" → Beides — wenn die Verteilung schief ist oder Ausreißer vorliegen. Bei symmetrischer Verteilung reicht der Mittelwert (mit SD). Goldstandard für die explorative Tabelle: M, SD, Median, Q1, Q3, Min, Max — so kann der Leser die Verteilung selbst einschätzen. Mehr dazu in unserem Beitrag zum Fragebogen auswerten.