Standardabweichung: Definition, Formel & Interpretation
Die Standardabweichung (SD, σ) ist das wichtigste Streuungsmaß in der Statistik. Definition, Formel, Interpretation und Berechnung in SPSS und R — mit klinischen Anwendungsbeispielen.
Definition
Die Standardabweichung (engl. standard deviation, kurz SD oder σ) ist das wichtigste Streuungsmaß in der Statistik. Sie beschreibt, wie stark die Einzelwerte einer Verteilung im Mittel um den arithmetischen Mittelwert streuen. Mathematisch ist die Standardabweichung die Quadratwurzel der Varianz — und besitzt damit denselben Maßstab und dieselbe Einheit wie die Originaldaten.
Eine kleine Standardabweichung bedeutet: Die Werte liegen eng beieinander, der Mittelwert ist repräsentativ. Eine große Standardabweichung bedeutet: Die Werte sind breit gestreut, einzelne Beobachtungen können weit vom Mittelwert abweichen.
Merke: Mittelwert ohne Standardabweichung ist in einer Doktorarbeit oder Publikation unzureichend. Erst beide zusammen — z.B. als M ± SD — beschreiben eine metrische Variable angemessen.
Formel
Populations-Standardabweichung (wenn die gesamte Grundgesamtheit bekannt ist):
$$\sigma = \sqrt{\frac{\sum_{i=1}^{N}(x_i - \mu)^2}{N}}$$
Stichproben-Standardabweichung (in der Forschungspraxis fast immer relevant — Bessel-Korrektur mit n − 1):
$$s = \sqrt{\frac{\sum_{i=1}^{n}(x_i - \bar{x})^2}{n - 1}}$$
Der Nenner n − 1 (statt n) bei der Stichproben-SD korrigiert für die Tatsache, dass der Stichprobenmittelwert selbst aus den Daten geschätzt wurde — er liefert eine erwartungstreue Schätzung der Populations-Varianz.
Praxis-Tipp: SPSS, R, Python und Stata berechnen standardmäßig die Stichproben-Standardabweichung mit n − 1. Das ist in 99 % der Forschungsfälle die korrekte Wahl.
Voraussetzungen
Die Standardabweichung ist nur dann ein sinnvolles Streuungsmaß, wenn:
- Skalenniveau metrisch — bei ordinalen oder nominalen Variablen ist die SD nicht definiert (stattdessen IQR oder Häufigkeiten verwenden)
- Verteilung annähernd symmetrisch — bei stark schiefen Verteilungen (z.B. Einkommen, Überlebenszeiten) ist die SD wenig aussagekräftig; besser Median + IQR berichten
- Keine extremen Ausreißer — die SD ist sehr ausreißersensibel, da quadrierte Abweichungen einfließen
- Ausreichende Stichprobengröße — bei n < 10 ist die SD nur eine grobe Schätzung
Bei schiefen Verteilungen oder Ausreißern ist die robuste Statistik mit Median + Interquartilsabstand (IQR) vorzuziehen.
Interpretation
Faustregeln bei Normalverteilung (68-95-99,7-Regel)
Liegt eine annähernde Normalverteilung vor, gilt:
| Bereich um Mittelwert | Anteil der Werte |
|---|---|
| μ ± 1·σ | ≈ 68,3 % |
| μ ± 2·σ | ≈ 95,4 % |
| μ ± 3·σ | ≈ 99,7 % |
Beispiel: Bei einem mittleren systolischen Blutdruck von M = 130 mmHg und SD = 12 mmHg liegen ca. 68 % der Patienten zwischen 118 und 142 mmHg, ca. 95 % zwischen 106 und 154 mmHg.
Variationskoeffizient für Vergleichbarkeit
Um die Streuung zweier Variablen mit unterschiedlichen Einheiten zu vergleichen, nutzt man den Variationskoeffizienten (CV):
$$CV = \frac{s}{\bar{x}} \cdot 100,%$$
Ein CV < 10 % gilt als geringe Streuung, > 30 % als hohe Streuung — das ist allerdings stark fachspezifisch zu interpretieren.
Klinisches Anwendungsbeispiel
Studie: HbA1c-Werte zweier Diabetiker-Kohorten (n = 80 pro Gruppe) nach 12 Wochen Therapie.
- Gruppe A (Metformin): M = 7,2 %, SD = 0,4 %
- Gruppe B (Placebo): M = 7,8 %, SD = 1,2 %
Interpretation:
- Beide Gruppen unterscheiden sich im Mittelwert um 0,6 Prozentpunkte.
- Die Streuung ist in Gruppe B dreimal so hoch (SD = 1,2 vs. 0,4). Das bedeutet: Metformin wirkt nicht nur stärker, sondern auch homogener — fast alle Patienten reagieren ähnlich. In der Placebo-Gruppe gibt es starke individuelle Schwankungen.
- Für einen t-Test muss die Varianzhomogenität geprüft werden (Levene-Test) — bei deutlich unterschiedlichen SDs wird der Welch-t-Test verwendet.
Berichtsform in der Publikation:
"Der HbA1c-Wert nach 12 Wochen lag in der Metformin-Gruppe bei M = 7,2 % (SD = 0,4) gegenüber M = 7,8 % (SD = 1,2) in der Placebo-Gruppe."
In SPSS berechnen
Analysieren → Deskriptive Statistiken → Deskriptive Statistik
Im Dialog Variable wählen, dann unter Optionen "Standardabweichung" anhaken (ist standardmäßig aktiviert). Output:
| N | Minimum | Maximum | Mittelwert | Standardabweichung | |
|---|---|---|---|---|---|
| HbA1c | 80 | 6,1 | 8,9 | 7,2 | ,40 |
Alternativ über Analysieren → Mittelwerte vergleichen → Mittelwerte für gruppierte Berechnungen. Eine ausführliche SPSS-Anleitung zeigt alle Schritte mit Screenshots.
In R berechnen
# Stichproben-Standardabweichung (n-1 im Nenner)
sd(df$hba1c)
# [1] 0.4023
# Mittelwert + SD zusammen
mean(df$hba1c)
sd(df$hba1c)
# Gruppiert per dplyr
library(dplyr)
df %>%
group_by(gruppe) %>%
summarise(
n = n(),
M = mean(hba1c, na.rm = TRUE),
SD = sd(hba1c, na.rm = TRUE)
)
# # A tibble: 2 × 4
# gruppe n M SD
# <chr> <int> <dbl> <dbl>
# 1 Metformin 80 7.20 0.40
# 2 Placebo 80 7.80 1.20
# Populations-SD (mit n im Nenner) — selten nötig
n <- length(df$hba1c)
sqrt(sum((df$hba1c - mean(df$hba1c))^2) / n)
Bei fehlenden Werten immer na.rm = TRUE setzen, sonst gibt R NA zurück.
Häufige Fehler
Fehler 1: Standardabweichung mit Standardfehler verwechseln
Der Standardfehler des Mittelwerts (SEM) ist SD/√n und beschreibt die Präzision des Mittelwertschätzers, nicht die Streuung der Einzelwerte. Beide werden in Publikationen verwechselt.
Faustregel: SD beschreibt die Daten, SEM beschreibt die Schätzung.
Fehler 2: SD bei stark schiefen Verteilungen berichten
Bei Überlebenszeiten, Wartezeiten oder Laborwerten mit Schiefe ist die SD irreführend. Stattdessen Median + Interquartilsabstand (IQR) oder Range angeben.
Fehler 3: SD ohne Mittelwert berichten
Eine SD allein ist informationslos. Immer als Paar M ± SD oder M (SD) berichten.
Fehler 4: Bessel-Korrektur ignorieren
Wer manuell rechnet und durch n statt n − 1 teilt, unterschätzt die Streuung systematisch — vor allem bei kleinen Stichproben (n < 30).
Fehler 5: SD bei ordinalen Daten (z.B. Likert-Skalen) angeben
Streng genommen ist die SD bei Likert-Items problematisch, weil das Skalenniveau nur ordinal ist. In der Praxis akzeptiert, aber Median + IQR sind robuster.
Verwandte Konzepte
- Varianz — das Quadrat der Standardabweichung; mathematisch gleichwertig, aber nicht in Originaleinheit
- Mittelwert — die SD ist nur sinnvoll als Begleiter des arithmetischen Mittels
- Normalverteilung — Grundlage für die 68-95-99,7-Regel
- Konfidenzintervall — basiert auf SD bzw. Standardfehler
- Standardfehler (SEM) — SD/√n, beschreibt Präzision des Mittelwerts
- Interquartilsabstand (IQR) — robuste Alternative zur SD bei schiefen Verteilungen
Häufige Fragen
- „Was ist der Unterschied zwischen Standardabweichung und Varianz?" → Die Varianz ist die mittlere quadrierte Abweichung vom Mittelwert. Die Standardabweichung ist deren Quadratwurzel — und damit in der gleichen Einheit wie die Originaldaten. Mathematisch enthalten beide identische Information; in der Praxis wird die SD bevorzugt, weil sie direkt interpretierbar ist (z.B. mmHg statt mmHg²).
- „Warum wird in der Stichproben-Standardabweichung durch n − 1 statt n geteilt?" → Das ist die Bessel-Korrektur. Sie korrigiert dafür, dass der Stichprobenmittelwert selbst aus den Daten geschätzt wird und dadurch die Abweichungen systematisch zu klein ausfallen würden. Mit n − 1 erhält man eine erwartungstreue Schätzung der Populations-Varianz.
- „Was ist der Unterschied zwischen Standardabweichung und Standardfehler (SEM)?" → Die SD beschreibt die Streuung der Einzelwerte um den Mittelwert. Der Standardfehler des Mittelwerts (SEM = SD/√n) beschreibt die Präzision, mit der der Stichprobenmittelwert den wahren Populationsmittelwert schätzt. SEM ist immer kleiner als SD und sinkt mit wachsender Stichprobengröße.
- „Wann ist die Standardabweichung kein gutes Streuungsmaß?" → Bei stark schiefen Verteilungen (z.B. Überlebenszeiten, Einkommen) oder bei ausgeprägten Ausreißern. Da die SD quadrierte Abweichungen verwendet, gewichtet sie extreme Werte überproportional. In solchen Fällen sind Median und Interquartilsabstand (IQR) robuster und aussagekräftiger.
- „Wie berichte ich Mittelwert und Standardabweichung in der Doktorarbeit korrekt?" → Üblich sind die Formate M = 7,2 (SD = 0,4) oder 7,2 ± 0,4. Wichtig: Stelle klar, ob du SD oder SEM angibst — beides wird leider oft verwechselt. Für klinische Publikationen empfiehlt sich nach CONSORT-Standard "M (SD)". Zusätzlich sollten n und Skalierung angegeben werden.
- „Warum ist meine SD in SPSS und R minimal unterschiedlich?" → Beide Programme berechnen standardmäßig die Stichproben-SD mit n − 1 und liefern identische Werte. Unterschiede entstehen meist durch Rundung in der Anzeige oder fehlende Werte, die unterschiedlich behandelt werden. Stelle sicher, dass in beiden Programmen dieselben Fälle einfließen.
- „Was bedeutet eine Standardabweichung von 0?" → Eine SD von genau 0 bedeutet, dass alle Beobachtungen identisch sind — es gibt keine Streuung. In der Praxis ist das bei kontinuierlichen Variablen extrem selten und deutet meist auf Mess- oder Eingabefehler hin (z.B. alle Werte fälschlich identisch eingegeben).
- „Kann ich die Standardabweichung für Likert-Skalen verwenden?" → Streng statistisch ist die SD nur für metrische Daten definiert, Likert-Items sind ordinal. In der Praxis akzeptiert die medizinische und psychologische Forschung die SD für Likert-Summenscores (≥ 5 Items). Für Einzel-Items sind Median und Häufigkeitsverteilung jedoch korrekter — siehe unsere Anleitung zur Likert-Auswertung.
- „Wie hängt die Standardabweichung mit dem Konfidenzintervall zusammen?" → Das 95%-Konfidenzintervall des Mittelwerts wird näherungsweise als M ± 1,96 · SEM berechnet, wobei SEM = SD/√n. Damit fließt die SD direkt ein: Je größer die SD, desto breiter das KI; je größer n, desto schmaler. Eine kleine SD und große n führen zu einem präzisen Mittelwertschätzer.