Was ist der Unterschied zwischen Standardabweichung und Varianz?

Die Varianz ist die mittlere quadrierte Abweichung vom Mittelwert. Die Standardabweichung ist deren Quadratwurzel — und damit in der gleichen Einheit wie die Originaldaten. Mathematisch enthalten beide identische Information; in der Praxis wird die SD bevorzugt, weil sie direkt interpretierbar ist (z.B. mmHg statt mmHg²).

Warum wird in der Stichproben-Standardabweichung durch n − 1 statt n geteilt?

Das ist die Bessel-Korrektur. Sie korrigiert dafür, dass der Stichprobenmittelwert selbst aus den Daten geschätzt wird und dadurch die Abweichungen systematisch zu klein ausfallen würden. Mit

Was ist der Unterschied zwischen Standardabweichung und Standardfehler (SEM)?

Die SD beschreibt die Streuung der Einzelwerte um den Mittelwert. Der Standardfehler des Mittelwerts (SEM = SD/√n) beschreibt die Präzision, mit der der Stichprobenmittelwert den wahren Populationsmittelwert schätzt. SEM ist immer kleiner als SD und sinkt mit wachsender Stichprobengröße.

Wann ist die Standardabweichung kein gutes Streuungsmaß?

Bei stark schiefen Verteilungen (z.B. Überlebenszeiten, Einkommen) oder bei ausgeprägten Ausreißern. Da die SD quadrierte Abweichungen verwendet, gewichtet sie extreme Werte überproportional. In solchen Fällen sind Median und Interquartilsabstand (IQR) robuster und aussagekräftiger.

Wie berichte ich Mittelwert und Standardabweichung in der Doktorarbeit korrekt?

Üblich sind die Formate M = 7,2 (SD = 0,4) oder 7,2 ± 0,4. Wichtig: Stelle klar, ob du SD oder SEM angibst — beides wird leider oft verwechselt. Für klinische Publikationen empfiehlt sich nach CONSORT-Standard "M (SD)". Zusätzlich sollten n und Skalierung angegeben werden.

Warum ist meine SD in SPSS und R minimal unterschiedlich?

Beide Programme berechnen standardmäßig die Stichproben-SD mit n − 1 und liefern identische Werte. Unterschiede entstehen meist durch Rundung in der Anzeige oder fehlende Werte, die unterschiedlich behandelt werden. Stelle sicher, dass in beiden Programmen dieselben Fälle einfließen.

Was bedeutet eine Standardabweichung von 0?

Eine SD von genau 0 bedeutet, dass alle Beobachtungen identisch sind — es gibt keine Streuung. In der Praxis ist das bei kontinuierlichen Variablen extrem selten und deutet meist auf Mess- oder Eingabefehler hin (z.B. alle Werte fälschlich identisch eingegeben).

Kann ich die Standardabweichung für Likert-Skalen verwenden?

Streng statistisch ist die SD nur für metrische Daten definiert, Likert-Items sind ordinal. In der Praxis akzeptiert die medizinische und psychologische Forschung die SD für Likert-Summenscores (≥ 5 Items). Für Einzel-Items sind Median und Häufigkeitsverteilung jedoch korrekter — siehe unsere [Anleitung zur Likert-Auswertung](/blog/likert-skala-auswertung).

Wie hängt die Standardabweichung mit dem Konfidenzintervall zusammen?

Das 95%-Konfidenzintervall des Mittelwerts wird näherungsweise als M ± 1,96 · SEM berechnet, wobei SEM = SD/√n. Damit fließt die SD direkt ein: Je größer die SD, desto breiter das KI; je größer n, desto schmaler. Eine kleine SD und große n führen zu einem präzisen Mittelwertschätzer.

Standardabweichung: Definition, Formel & Interpretation

Die Standardabweichung (SD, σ) ist das wichtigste Streuungsmaß in der Statistik. Definition, Formel, Interpretation und Berechnung in SPSS und R — mit klinischen Anwendungsbeispielen.

📊 Streuungsmaße · ⏱️ 8 Min. · Aktualisiert 2026-05-10

Definition

Die Standardabweichung (engl. standard deviation, kurz SD oder σ) ist das wichtigste Streuungsmaß in der Statistik. Sie beschreibt, wie stark die Einzelwerte einer Verteilung im Mittel um den arithmetischen Mittelwert streuen. Mathematisch ist die Standardabweichung die Quadratwurzel der Varianz — und besitzt damit denselben Maßstab und dieselbe Einheit wie die Originaldaten.

Eine kleine Standardabweichung bedeutet: Die Werte liegen eng beieinander, der Mittelwert ist repräsentativ. Eine große Standardabweichung bedeutet: Die Werte sind breit gestreut, einzelne Beobachtungen können weit vom Mittelwert abweichen.

Merke: Mittelwert ohne Standardabweichung ist in einer Doktorarbeit oder Publikation unzureichend. Erst beide zusammen — z.B. als M ± SD — beschreiben eine metrische Variable angemessen.

Formel

Populations-Standardabweichung (wenn die gesamte Grundgesamtheit bekannt ist):

$$\sigma = \sqrt{\frac{\sum_{i=1}^{N}(x_i - \mu)^2}{N}}$$

Stichproben-Standardabweichung (in der Forschungspraxis fast immer relevant — Bessel-Korrektur mit n − 1):

$$s = \sqrt{\frac{\sum_{i=1}^{n}(x_i - \bar{x})^2}{n - 1}}$$

Der Nenner n − 1 (statt n) bei der Stichproben-SD korrigiert für die Tatsache, dass der Stichprobenmittelwert selbst aus den Daten geschätzt wurde — er liefert eine erwartungstreue Schätzung der Populations-Varianz.

Praxis-Tipp: SPSS, R, Python und Stata berechnen standardmäßig die Stichproben-Standardabweichung mit n − 1. Das ist in 99 % der Forschungsfälle die korrekte Wahl.

Voraussetzungen

Die Standardabweichung ist nur dann ein sinnvolles Streuungsmaß, wenn:

Skalenniveau metrisch — bei ordinalen oder nominalen Variablen ist die SD nicht definiert (stattdessen IQR oder Häufigkeiten verwenden)
Verteilung annähernd symmetrisch — bei stark schiefen Verteilungen (z.B. Einkommen, Überlebenszeiten) ist die SD wenig aussagekräftig; besser Median + IQR berichten
Keine extremen Ausreißer — die SD ist sehr ausreißersensibel, da quadrierte Abweichungen einfließen
Ausreichende Stichprobengröße — bei n < 10 ist die SD nur eine grobe Schätzung

Bei schiefen Verteilungen oder Ausreißern ist die robuste Statistik mit Median + Interquartilsabstand (IQR) vorzuziehen.

Interpretation

Faustregeln bei Normalverteilung (68-95-99,7-Regel)

Liegt eine annähernde Normalverteilung vor, gilt:

Bereich um Mittelwert	Anteil der Werte
μ ± 1·σ	≈ 68,3 %
μ ± 2·σ	≈ 95,4 %
μ ± 3·σ	≈ 99,7 %

Beispiel: Bei einem mittleren systolischen Blutdruck von M = 130 mmHg und SD = 12 mmHg liegen ca. 68 % der Patienten zwischen 118 und 142 mmHg, ca. 95 % zwischen 106 und 154 mmHg.

Variationskoeffizient für Vergleichbarkeit

Um die Streuung zweier Variablen mit unterschiedlichen Einheiten zu vergleichen, nutzt man den Variationskoeffizienten (CV):

$$CV = \frac{s}{\bar{x}} \cdot 100,%$$

Ein CV < 10 % gilt als geringe Streuung, > 30 % als hohe Streuung — das ist allerdings stark fachspezifisch zu interpretieren.

Klinisches Anwendungsbeispiel

Studie: HbA1c-Werte zweier Diabetiker-Kohorten (n = 80 pro Gruppe) nach 12 Wochen Therapie.

Gruppe A (Metformin): M = 7,2 %, SD = 0,4 %
Gruppe B (Placebo): M = 7,8 %, SD = 1,2 %

Interpretation:

Beide Gruppen unterscheiden sich im Mittelwert um 0,6 Prozentpunkte.
Die Streuung ist in Gruppe B dreimal so hoch (SD = 1,2 vs. 0,4). Das bedeutet: Metformin wirkt nicht nur stärker, sondern auch homogener — fast alle Patienten reagieren ähnlich. In der Placebo-Gruppe gibt es starke individuelle Schwankungen.
Für einen t-Test muss die Varianzhomogenität geprüft werden (Levene-Test) — bei deutlich unterschiedlichen SDs wird der Welch-t-Test verwendet.

Berichtsform in der Publikation:

"Der HbA1c-Wert nach 12 Wochen lag in der Metformin-Gruppe bei M = 7,2 % (SD = 0,4) gegenüber M = 7,8 % (SD = 1,2) in der Placebo-Gruppe."

In SPSS berechnen

Analysieren → Deskriptive Statistiken → Deskriptive Statistik

Im Dialog Variable wählen, dann unter Optionen "Standardabweichung" anhaken (ist standardmäßig aktiviert). Output:

	N	Minimum	Maximum	Mittelwert	Standardabweichung
HbA1c	80	6,1	8,9	7,2	,40

Alternativ über Analysieren → Mittelwerte vergleichen → Mittelwerte für gruppierte Berechnungen. Eine ausführliche SPSS-Anleitung zeigt alle Schritte mit Screenshots.

In R berechnen

# Stichproben-Standardabweichung (n-1 im Nenner)
sd(df$hba1c)
# [1] 0.4023

# Mittelwert + SD zusammen
mean(df$hba1c)
sd(df$hba1c)

# Gruppiert per dplyr
library(dplyr)
df %>%
  group_by(gruppe) %>%
  summarise(
    n = n(),
    M = mean(hba1c, na.rm = TRUE),
    SD = sd(hba1c, na.rm = TRUE)
  )
# # A tibble: 2 × 4
#   gruppe        n     M    SD
#   <chr>     <int> <dbl> <dbl>
# 1 Metformin    80  7.20  0.40
# 2 Placebo      80  7.80  1.20

# Populations-SD (mit n im Nenner) — selten nötig
n <- length(df$hba1c)
sqrt(sum((df$hba1c - mean(df$hba1c))^2) / n)

Bei fehlenden Werten immer na.rm = TRUE setzen, sonst gibt R NA zurück.

Häufige Fehler

Fehler 1: Standardabweichung mit Standardfehler verwechseln

Der Standardfehler des Mittelwerts (SEM) ist SD/√n und beschreibt die Präzision des Mittelwertschätzers, nicht die Streuung der Einzelwerte. Beide werden in Publikationen verwechselt.

Faustregel: SD beschreibt die Daten, SEM beschreibt die Schätzung.

Fehler 2: SD bei stark schiefen Verteilungen berichten

Bei Überlebenszeiten, Wartezeiten oder Laborwerten mit Schiefe ist die SD irreführend. Stattdessen Median + Interquartilsabstand (IQR) oder Range angeben.

Fehler 3: SD ohne Mittelwert berichten

Eine SD allein ist informationslos. Immer als Paar M ± SD oder M (SD) berichten.

Fehler 4: Bessel-Korrektur ignorieren

Wer manuell rechnet und durch n statt n − 1 teilt, unterschätzt die Streuung systematisch — vor allem bei kleinen Stichproben (n < 30).

Fehler 5: SD bei ordinalen Daten (z.B. Likert-Skalen) angeben

Streng genommen ist die SD bei Likert-Items problematisch, weil das Skalenniveau nur ordinal ist. In der Praxis akzeptiert, aber Median + IQR sind robuster.

Häufige Fragen

„Was ist der Unterschied zwischen Standardabweichung und Varianz?" → Die Varianz ist die mittlere quadrierte Abweichung vom Mittelwert. Die Standardabweichung ist deren Quadratwurzel — und damit in der gleichen Einheit wie die Originaldaten. Mathematisch enthalten beide identische Information; in der Praxis wird die SD bevorzugt, weil sie direkt interpretierbar ist (z.B. mmHg statt mmHg²).
„Warum wird in der Stichproben-Standardabweichung durch n − 1 statt n geteilt?" → Das ist die Bessel-Korrektur. Sie korrigiert dafür, dass der Stichprobenmittelwert selbst aus den Daten geschätzt wird und dadurch die Abweichungen systematisch zu klein ausfallen würden. Mit n − 1 erhält man eine erwartungstreue Schätzung der Populations-Varianz.
„Was ist der Unterschied zwischen Standardabweichung und Standardfehler (SEM)?" → Die SD beschreibt die Streuung der Einzelwerte um den Mittelwert. Der Standardfehler des Mittelwerts (SEM = SD/√n) beschreibt die Präzision, mit der der Stichprobenmittelwert den wahren Populationsmittelwert schätzt. SEM ist immer kleiner als SD und sinkt mit wachsender Stichprobengröße.
„Wann ist die Standardabweichung kein gutes Streuungsmaß?" → Bei stark schiefen Verteilungen (z.B. Überlebenszeiten, Einkommen) oder bei ausgeprägten Ausreißern. Da die SD quadrierte Abweichungen verwendet, gewichtet sie extreme Werte überproportional. In solchen Fällen sind Median und Interquartilsabstand (IQR) robuster und aussagekräftiger.
„Wie berichte ich Mittelwert und Standardabweichung in der Doktorarbeit korrekt?" → Üblich sind die Formate M = 7,2 (SD = 0,4) oder 7,2 ± 0,4. Wichtig: Stelle klar, ob du SD oder SEM angibst — beides wird leider oft verwechselt. Für klinische Publikationen empfiehlt sich nach CONSORT-Standard "M (SD)". Zusätzlich sollten n und Skalierung angegeben werden.
„Warum ist meine SD in SPSS und R minimal unterschiedlich?" → Beide Programme berechnen standardmäßig die Stichproben-SD mit n − 1 und liefern identische Werte. Unterschiede entstehen meist durch Rundung in der Anzeige oder fehlende Werte, die unterschiedlich behandelt werden. Stelle sicher, dass in beiden Programmen dieselben Fälle einfließen.
„Was bedeutet eine Standardabweichung von 0?" → Eine SD von genau 0 bedeutet, dass alle Beobachtungen identisch sind — es gibt keine Streuung. In der Praxis ist das bei kontinuierlichen Variablen extrem selten und deutet meist auf Mess- oder Eingabefehler hin (z.B. alle Werte fälschlich identisch eingegeben).
„Kann ich die Standardabweichung für Likert-Skalen verwenden?" → Streng statistisch ist die SD nur für metrische Daten definiert, Likert-Items sind ordinal. In der Praxis akzeptiert die medizinische und psychologische Forschung die SD für Likert-Summenscores (≥ 5 Items). Für Einzel-Items sind Median und Häufigkeitsverteilung jedoch korrekter — siehe unsere Anleitung zur Likert-Auswertung.
„Wie hängt die Standardabweichung mit dem Konfidenzintervall zusammen?" → Das 95%-Konfidenzintervall des Mittelwerts wird näherungsweise als M ± 1,96 · SEM berechnet, wobei SEM = SD/√n. Damit fließt die SD direkt ein: Je größer die SD, desto breiter das KI; je größer n, desto schmaler. Eine kleine SD und große n führen zu einem präzisen Mittelwertschätzer.

✅ Fachlich geprüft von PD Dr. Dr. Andreas Vollmer