Modus: Definition, Berechnung & Interpretation
Der Modus ist der häufigste Wert einer Verteilung — das einzige Lagemaß, das auch für nominalskalierte Daten gilt. Definition, Interpretation, Berechnung in SPSS und R.
Definition
Der Modus (auch: Modalwert) ist der häufigste Wert in einer Datenreihe — also derjenige Ausprägungswert, der am häufigsten beobachtet wird. Er ist neben Mittelwert und Median eines der drei klassischen Lagemaße der deskriptiven Statistik, hat aber eine Sonderstellung: Der Modus ist das einzige Lagemaß, das auch für nominalskalierte Daten (z.B. Blutgruppe, Diagnoseklasse, Geschlecht) definiert ist.
Merke: Mittelwert und Median brauchen mindestens Ordinalskalenniveau. Der Modus funktioniert immer — von der Blutgruppe über den Schulnoten-Likert bis zum metrischen BMI.
Eine Verteilung kann einen Modus (unimodal), zwei Modi (bimodal) oder mehrere Modi (multimodal) besitzen. Bimodale Verteilungen sind diagnostisch wertvoll: sie deuten oft auf eine Vermischung zweier Subpopulationen hin.
Voraussetzungen
Der Modus ist außerordentlich anspruchslos:
- Skalenniveau: beliebig — nominal, ordinal, metrisch
- Stichprobengröße: keine Mindestanforderung (theoretisch n ≥ 1)
- Verteilungsannahmen: keine
- Diskrete vs. stetige Daten: Bei rein stetigen Messdaten (z.B. Blutdruck auf Dezimalstellen) ist der "rohe" Modus selten sinnvoll, weil jeder Wert nur einmal auftritt. Hier wird klassiert und der modale Klassenmittelpunkt berichtet.
Mehr zur strukturierten Auswertung kategorialer Daten findest du in unserer Anleitung zum Fragebogen auswerten.
Interpretation
Der Modus beantwortet die Frage: "Welche Ausprägung kommt am häufigsten vor?"
| Skalenniveau | Beispielwert | Interpretation |
|---|---|---|
| Nominal | Blutgruppe 0+ | Häufigste Blutgruppe in der Stichprobe |
| Ordinal | NRS-Wert 7 | Häufigster berichteter Schmerzwert |
| Metrisch (klassiert) | BMI-Klasse 25–30 | Häufigste BMI-Spanne |
Wichtige Sonderfälle:
- Unimodal: ein einziger Spitzenwert (z.B. Normalverteilung mit Modus = Mittelwert = Median).
- Bimodal: zwei lokale Häufigkeitsgipfel — Hinweis auf zwei vermischte Subpopulationen (z.B. Wachstumskurven von Jungen und Mädchen gemeinsam ausgewertet).
- Multimodal: drei oder mehr Gipfel — meist Hinweis auf heterogene Daten.
- Kein Modus: Wenn alle Werte exakt gleich häufig auftreten, gibt es streng genommen keinen Modus.
Praxis-Tipp: Bei einer schiefen Verteilung (z.B. CRP-Werte, Liegedauern) gilt: Modus < Median < Mittelwert (rechtsschief) bzw. umgekehrt bei linksschiefer Verteilung. Diese Reihenfolge ist ein nützlicher Plausibilitätscheck für deine deskriptive Statistik.
Klinisches Anwendungsbeispiel
Studie: Erfassung der präoperativ dokumentierten ASA-Klassifikation bei n = 200 Patienten vor elektiver Koronarbypass-OP.
| ASA-Klasse | Häufigkeit | Prozent |
|---|---|---|
| ASA I | 8 | 4,0 % |
| ASA II | 47 | 23,5 % |
| ASA III | 112 | 56,0 % |
| ASA IV | 33 | 16,5 % |
| ASA V | 0 | 0,0 % |
Modus = ASA III (n = 112; 56 %).
Interpretation: Der typische Patient in dieser Bypass-Kohorte ist ASA III — also ein Patient mit schwerer systemischer Erkrankung und funktioneller Einschränkung. Mittelwert und Median wären hier zwar berechenbar (ordinal interpretiert), aber der Modus ist der klinisch direkt verwertbare Kennwert für die Versorgungsplanung.
Bimodalitäts-Beispiel: Würde man Liegedauern auf einer gemischten Station auswerten und fände zwei Gipfel bei 3 und 14 Tagen, läge eine bimodale Verteilung vor — ein Hinweis darauf, dass tatsächlich zwei Patientengruppen (z.B. ambulante Kurzlieger vs. komplikative Langlieger) vermischt analysiert werden.
In SPSS berechnen
Analysieren → Deskriptive Statistiken → Häufigkeiten → [Variable wählen] → Statistik → ☑ Modalwert
Im Output:
- "Modus" zeigt den häufigsten Wert.
- Bei mehreren Modi zeigt SPSS standardmäßig nur den kleinsten und vermerkt mit Fußnote "Mehrere Modi vorhanden. Der kleinste Wert wird angezeigt." — hier muss die zugehörige Häufigkeitstabelle zwingend mit ausgewertet werden, sonst entgeht dir eine Bimodalität.
Für eine umfassende Auswertungsroutine empfehlen wir, Modus immer zusammen mit der Häufigkeitstabelle und einem Balkendiagramm zu berichten.
In R berechnen
Base-R hat keine eingebaute Modus-Funktion (mode() gibt den Speichertyp zurück, nicht den statistischen Modus). Deshalb wird der Modus manuell oder über Pakete bestimmt:
# Variante 1: einfache Funktion (gibt nur einen Modus zurück)
get_modus <- function(x) {
ux <- unique(x[!is.na(x)])
ux[which.max(tabulate(match(x, ux)))]
}
get_modus(df$asa_klasse)
# [1] 3
# Variante 2: alle Modi (für bimodale/multimodale Verteilungen)
get_alle_modi <- function(x) {
tab <- table(x)
as.numeric(names(tab)[tab == max(tab)])
}
get_alle_modi(df$asa_klasse)
# Variante 3: aus Häufigkeitstabelle ablesen (immer empfehlenswert)
sort(table(df$asa_klasse), decreasing = TRUE)
Das Paket DescTools::Mode() liefert den Modus inklusive Häufigkeit und ist robust gegenüber Bindungen.
Häufige Fehler
Fehler 1: Modus mit Mittelwert verwechseln
"Der durchschnittliche Patient hatte ASA III" ist falsch, wenn ASA III der Modus ist — korrekt wäre "der häufigste ASA-Status war III". Mittelwert würde rechnerisch z.B. 2,85 ergeben, was klinisch keinen Sinn hat.
Fehler 2: Bei stetigen Daten den rohen Modus berichten
Bei n = 100 Blutdruckmessungen mit Werten wie 132,4 / 128,7 / 141,2 mmHg ist meist jeder Wert einzigartig — der "Modus" wird zufällig. Lösung: klassieren (z.B. 5er-Schritte) oder Modus weglassen und stattdessen Mittelwert ± SD berichten.
Fehler 3: Bimodalität übersehen
SPSS zeigt bei Bimodalität nur den kleineren Modus an. Wer die Fußnote überliest, übersieht möglicherweise eine vermischte Population — methodisch ein gravierender Befund.
Fehler 4: Modus als alleiniges Lagemaß bei metrischen Daten
Bei intervall- oder verhältnisskalierten Daten ist der Modus nicht das informativste Lagemaß. Er sollte nur ergänzend zu Mittelwert und Median berichtet werden.
Fehler 5: "Kein Modus vorhanden" mit "Daten sind gleichverteilt" verwechseln
Wenn alle Werte exakt gleich oft vorkommen, existiert formal kein eindeutiger Modus — daraus folgt aber nicht, dass die zugrundeliegende Population gleichverteilt ist. Stichprobengröße prüfen.
Verwandte Konzepte
- Mittelwert — arithmetisches Lagemaß für metrische Daten
- Median — robuster Lagemaß-Wert, der die Stichprobe halbiert
- Häufigkeitsverteilung — Grundlage zur Modusbestimmung
- Schiefe — beeinflusst die Reihenfolge Modus / Median / Mittelwert
- Standardabweichung — Streuungsmaß, das den Modus ergänzt
Häufige Fragen
- „Was ist der Unterschied zwischen Modus, Median und Mittelwert?" → Der Modus ist der häufigste Wert, der Median der mittlere Wert (50%-Punkt) einer geordneten Datenreihe, der Mittelwert das arithmetische Mittel. Bei symmetrischen Verteilungen fallen alle drei zusammen, bei schiefen Verteilungen unterscheiden sie sich systematisch — bei rechtsschiefen Daten gilt Modus < Median < Mittelwert.
- „Kann eine Verteilung mehrere Modi haben?" → Ja. Eine Verteilung mit zwei lokalen Häufigkeitsgipfeln heißt bimodal, mit drei oder mehr multimodal. Bimodalität ist diagnostisch wertvoll und deutet meist auf eine Vermischung zweier Subpopulationen hin — ein wichtiger Befund, der nicht ignoriert werden sollte.
- „Funktioniert der Modus auch für Blutgruppe und Geschlecht?" → Ja, und genau das ist die Stärke des Modus. Er ist das einzige Lagemaß, das auf nominalskalierte Daten anwendbar ist. Mittelwert oder Median für Blutgruppen zu berechnen, wäre sinnlos — der Modus ist hier der korrekte Kennwert.
- „Warum zeigt SPSS bei mehreren Modi nur einen Wert?" → SPSS gibt bei mehreren gleich häufigen Modalwerten standardmäßig nur den kleinsten zurück und vermerkt dies in einer Fußnote. Diese Fußnote wird in der Praxis oft übersehen. Prüfe daher immer zusätzlich die vollständige Häufigkeitstabelle und ein Balkendiagramm, um Bimodalitäten nicht zu übersehen.
- „Hat R eine Modus-Funktion?" → Nein, Base-R hat keine eingebaute Funktion für den statistischen Modus — die Funktion
mode()liefert den Speichertyp eines Objekts. Der Modus muss entweder per Eigenfunktion mittabulate()undmatch()berechnet oder über Pakete wieDescTools::Mode()ermittelt werden. - „Ist der Modus bei stetigen Messdaten sinnvoll?" → Eingeschränkt. Bei rein stetigen Daten ist meist jeder Wert einzigartig, sodass der rohe Modus zufällig wird. Sinnvoller ist es, die Daten zu klassieren (z.B. BMI in 5er-Schritten) und den modalen Klassenmittelpunkt zu berichten — oder bei stetigen Daten ganz auf Mittelwert und Median auszuweichen.
- „Was sagt mir Bimodalität klinisch?" → Eine bimodale Verteilung ist häufig ein Warnsignal: deine Stichprobe enthält wahrscheinlich zwei unterschiedliche Subgruppen (z.B. Männer und Frauen, Kinder und Erwachsene, oder zwei Krankheitsstadien), die getrennt analysiert werden sollten. Eine globale Mittelwert-Auswertung würde beide Gruppen verdecken und ist methodisch unsauber.
- „Muss ich den Modus in einer Doktorarbeit immer berichten?" → Bei nominalen und ordinalen Variablen ja — gemeinsam mit der Häufigkeitstabelle und ggf. dem prozentualen Anteil. Bei metrischen Daten ist der Modus optional und nur dann wichtig, wenn er einen relevanten Befund (z.B. Bimodalität) aufdeckt. Standard sind sonst Mittelwert ± SD bzw. Median mit IQR.