Fragebogen auswerten: Komplette Anleitung mit Excel, SPSS & R 2026
Fragebogen auswerten Schritt für Schritt: Codierung, Datenqualität, deskriptive Statistik, Reliabilität, Hypothesenprüfung, multivariate Analysen. Mit Excel-, SPSS- und R-Anleitungen sowie Tipps für Online-Surveys.
Fragebogen auswerten klingt machbar, wird aber schnell komplex. Welche Skalen hast du? Wie gehst du mit fehlenden Antworten um? Welcher statistische Test passt? Und wie bekommst du aus 200 ausgefüllten Bögen einen sauberen Ergebnisteil?
Dieser Leitfaden zeigt dir den vollständigen Ablauf der Fragebogenauswertung — von der Dateneingabe bis zur multivariaten Analyse und Online-Survey-Besonderheiten. Mit konkreten Anleitungen für Excel, SPSS Schritt für Schritt und R. Wenn du dich speziell zu Likert-Skalen orientieren willst, ergänzt unser Beitrag zur Likert-Skala-Auswertung diese Anleitung.
Vor der Auswertung: Fragebogendesign prüfen
Bevor du mit der Auswertung beginnst, solltest du sicherstellen, dass dein Fragebogen methodisch sauber konstruiert ist. Ein schlecht designter Fragebogen liefert Daten, die kein statistisches Verfahren retten kann.
Skalenniveau bestimmen. Jede Frage produziert Daten auf einem bestimmten Skalenniveau — und dieses Niveau bestimmt, welche Auswertungsmethoden erlaubt sind. Nominalskala (z.B. Geschlecht, Fachrichtung) erlaubt nur Häufigkeiten und Chi-Quadrat-Tests. Ordinalskala (z.B. Likert-Skalen: "stimme gar nicht zu" bis "stimme voll zu") erlaubt Mediane und nicht-parametrische Tests. Metrische Skala (z.B. Alter, Einkommen) erlaubt Mittelwerte, Standardabweichungen und parametrische Tests.
Likert-Skalen: Ordinal oder metrisch? Die ewige Debatte. Technisch sind Likert-Skalen ordinal. In der Praxis behandeln die meisten Forscher Summenscores aus mehreren Likert-Items als quasi-metrisch — das ist bei mindestens 5 Items pro Skala und annähernder Normalverteilung vertretbar. Einzelne Likert-Items solltest du dagegen immer ordinal auswerten.
Reliabilität prüfen. Wenn du einen standardisierten Fragebogen verwendest (z.B. PHQ-9, SF-36), ist die Reliabilität belegt. Bei selbst konstruierten Fragebögen musst du Cronbach's Alpha berechnen — ein Wert ≥ 0,7 gilt als akzeptabel, ≥ 0,8 als gut.
Schritt 1: Dateneingabe und Codierung
In Excel
Erstelle eine Tabelle mit einer Zeile pro Teilnehmer und einer Spalte pro Frage. Die erste Zeile enthält die Variablennamen (kurz und eindeutig: alter, geschlecht, frage_1, frage_2, ...). Codiere alle Antworten numerisch: "männlich" = 1, "weiblich" = 2, "divers" = 3. Bei Likert-Skalen: "stimme gar nicht zu" = 1 bis "stimme voll zu" = 5.
Fehlende Werte einheitlich codieren — am besten leer lassen oder 999 eintragen (nie 0, das ist ein gültiger Wert). In SPSS definierst du 999 als Missing Value, in R als NA.
In SPSS
Importiere deine Excel-Datei über Datei → Öffnen → Daten. Wechsle in die Variablenansicht und definiere für jede Variable: Name, Typ, Wertelabels (z.B. 1 = "männlich"), Skalenniveau (Nominal/Ordinal/Metrisch) und Fehlende Werte.
In R
daten <- read.csv("fragebogen.csv", header = TRUE, sep = ";")
str(daten) # Struktur prüfen
summary(daten) # Überblick
Schritt 2: Datenbereinigung
Bevor du analysierst, bereinige deine Daten. Prüfe auf unplausible Werte (z.B. Alter = 350), auf Muster, die auf unaufmerksames Ausfüllen hindeuten (z.B. alle Fragen identisch beantwortet — "Straightlining"), und auf den Anteil fehlender Werte pro Teilnehmer (bei > 20% fehlenden Antworten: Ausschluss erwägen).
Dokumentiere jeden Bereinigungsschritt transparent — das gehört in den Methodenteil deiner Arbeit.
Schritt 3: Deskriptive Auswertung
Die deskriptive Statistik ist der erste und wichtigste Schritt bei der Fragebogenauswertung. Sie beschreibt deine Stichprobe und gibt einen Überblick über die Antwortverteilungen.
Stichprobenbeschreibung
Erstelle eine Tabelle mit den demografischen Merkmalen: Alter (Mittelwert ± Standardabweichung oder Median mit IQR), Geschlecht (absolute und relative Häufigkeiten), und weitere relevante Merkmale wie Fachsemester, Berufserfahrung etc.
In Excel
Für Mittelwert und Standardabweichung: =MITTELWERT(B2:B201) und =STABW.S(B2:B201). Für Häufigkeiten: =ZÄHLENWENN(C2:C201;1) zählt, wie oft der Wert 1 vorkommt. Für relative Häufigkeiten: die absolute Häufigkeit durch die Gesamtzahl teilen.
Excel reicht für einfache deskriptive Statistik und Häufigkeitstabellen. Für alles darüber hinaus — Hypothesentests, Reliabilitätsanalysen, Regressionen — empfehle ich SPSS oder R.
In SPSS
Analysieren → Deskriptive Statistiken → Häufigkeiten (für kategoriale Variablen) oder Deskriptive Statistiken → Deskriptive Statistiken (für metrische Variablen). Für Kreuztabellen: Analysieren → Deskriptive Statistiken → Kreuztabellen.
In R
# Deskriptive Übersicht
library(psych)
describe(daten)
# Häufigkeitstabelle
table(daten$geschlecht)
prop.table(table(daten$geschlecht))
Schritt 4: Skalen bilden und Reliabilität prüfen
Wenn dein Fragebogen mehrere Items zu einem Konstrukt zusammenfasst (z.B. 5 Items zu "Arbeitszufriedenheit"), musst du einen Summenscore oder Mittelwertscore bilden.
Cronbach's Alpha berechnen
In SPSS: Analysieren → Skalierung → Reliabilitätsanalyse → Items der Skala auswählen → Modell: Alpha. Ein Wert ≥ 0,7 ist das Minimum. Prüfe die Spalte "Cronbach's Alpha, wenn Item entfernt" — wenn das Alpha durch Entfernen eines Items deutlich steigt, ist dieses Item problematisch.
In R:
library(psych)
alpha(daten[, c("item1", "item2", "item3", "item4", "item5")])
Score bilden
In SPSS: Transformieren → Berechne Variable → skala_score = MEAN(item1, item2, item3, item4, item5). MEAN ignoriert automatisch fehlende Werte (im Gegensatz zu einer manuellen Summe).
In Excel: =MITTELWERT(D2;E2;F2;G2;H2)
Schritt 5: Hypothesenprüfung
Jetzt wird es spannend: Du prüfst, ob deine Hypothesen statistisch bestätigt werden.
Gruppenunterschiede
"Unterscheidet sich die Zufriedenheit zwischen Männern und Frauen?" Zwei unabhängige Gruppen, metrische abhängige Variable → Prüfe Normalverteilung (Shapiro-Wilk). Bei Normalverteilung: Ungepaarter t-Test. Bei Verletzung: Mann-Whitney-U-Test.
In SPSS: Analysieren → Mittelwerte vergleichen → T-Test bei unabhängigen Stichproben.
In R: t.test(zufriedenheit ~ geschlecht, data = daten) oder wilcox.test(zufriedenheit ~ geschlecht, data = daten).
"Unterscheidet sich die Zufriedenheit zwischen drei Fachbereichen?" Mehr als zwei Gruppen → ANOVA (normalverteilt) oder Kruskal-Wallis (nicht normalverteilt). Bei signifikantem Ergebnis: Post-hoc-Tests (Tukey oder Dunn mit Bonferroni).
Zusammenhänge
"Hängt die Studienzufriedenheit mit der Prüfungsangst zusammen?" Zwei metrische Variablen → Pearson-Korrelation (normalverteilt) oder Spearman-Rangkorrelation (nicht normalverteilt / ordinal).
In SPSS: Analysieren → Korrelation → Bivariat.
In R: cor.test(daten$zufriedenheit, daten$pruefungsangst, method = "spearman").
Einflussfaktoren
"Welche Faktoren beeinflussen die Studienzufriedenheit?" Multiple lineare Regression mit Zufriedenheit als abhängiger Variable und Alter, Geschlecht, Prüfungsangst etc. als unabhängigen Variablen.
In SPSS: Analysieren → Regression → Linear.
In R: modell <- lm(zufriedenheit ~ alter + geschlecht + pruefungsangst, data = daten); summary(modell).
Häufigkeitsvergleiche
"Gibt es einen Zusammenhang zwischen Geschlecht und Studienfachwahl?" Zwei kategoriale Variablen → Chi-Quadrat-Test.
In SPSS: Analysieren → Deskriptive Statistiken → Kreuztabellen → Statistiken → Chi-Quadrat.
Schritt 6: Ergebnisse darstellen
Tabellen
Erstelle übersichtliche Tabellen mit den wichtigsten Kennwerten. Für Gruppenvergleiche: Gruppenmittelwerte (M), Standardabweichungen (SD), Teststatistik, p-Wert und Effektstärke. Für Korrelationen: Korrelationsmatrix mit r-Werten und Signifikanzkennzeichnung.
Grafiken
Balkendiagramme für Häufigkeitsverteilungen. Boxplots für Gruppenvergleiche. Streudiagramme für Zusammenhänge. In SPSS über Grafiken → Diagrammerstellung. In R mit ggplot2 — die Grafiken sind publikationsfertig.
Ergebnisteil schreiben
Berichte Ergebnisse nach APA-Standard: "Frauen berichteten eine signifikant höhere Studienzufriedenheit als Männer (M = 3,8 ± 0,9 vs. M = 3,4 ± 1,1; t(198) = 2,73; p = 0,007; d = 0,39)."
Häufige Fehler bei der Fragebogenauswertung
Einzelne Likert-Items mit parametrischen Tests auswerten. Einzelitems sind ordinal — verwende Mann-Whitney-U statt t-Test. Summenscores aus mehreren Items darfst du (bei annähernder Normalverteilung) parametrisch auswerten.
Reliabilität nicht prüfen. Ohne Cronbach's Alpha weißt du nicht, ob deine Skala tatsächlich misst, was sie messen soll. Gutachter fragen immer danach.
Fehlende Werte ignorieren. Dokumentiere den Anteil fehlender Werte und deine Strategie im Umgang damit (Listenweiser Ausschluss, paarweiser Ausschluss, Imputation).
Zu viele Tests ohne Korrektur. Wenn du 20 Items einzeln testest, bekommst du rein zufällig ein signifikantes Ergebnis. Fasse Items zu Skalen zusammen und korrigiere für multiples Testen.
Rücklaufquote nicht berichten. Wie viele Fragebögen hast du verteilt, wie viele kamen zurück, wie viele waren auswertbar? Das gehört in den Methodenteil.
Fragebogen auswerten: Excel vs. SPSS vs. R
Excel eignet sich für einfache Fragebogenauswertungen mit deskriptiver Statistik: Häufigkeiten, Mittelwerte, Balkendiagramme. Für Hypothesentests ist Excel nicht geeignet — es fehlen die wichtigsten Tests, und die Formeln sind fehleranfällig.
SPSS ist der Standard für Fragebogenauswertungen an Universitäten. Menügesteuert, kein Programmieren nötig, alle wichtigen Tests enthalten. Für Bachelorarbeiten und Masterarbeiten die beste Wahl. Allerdings: SPSS kostet Geld (Uni-Lizenz prüfen).
R ist kostenlos und das mächtigste Tool — mit Paketen wie psych, lavaan und ggplot2 lässt sich jede Fragebogenauswertung umsetzen. Lernkurve ist steiler, aber die Investition lohnt sich langfristig.
Multivariate Analysen: Wenn mehrere Faktoren wirken
Wenn du nicht nur einzelne Zusammenhänge prüfst, sondern mehrere Prädiktoren gleichzeitig untersuchst, brauchst du multivariate Modelle.
Multiple lineare Regression
Beispiel: "Welche Faktoren prädizieren die Patientenzufriedenheit?"
Prädiktoren: Alter, Geschlecht, Wartezeit, wahrgenommene Arzt-Qualität, BMI.
- In SPSS: Analysieren → Regression → Linear → Modell mit allen Prädiktoren spezifizieren
- Wichtig: Multikollinearität prüfen (VIF < 5), Residuen-Diagnostik (Q-Q-Plot)
- Berichte standardisierte β für die Vergleichbarkeit der Prädiktoren
Logistische Regression
Bei binärer abhängiger Variable (z. B. Therapietreue ja/nein): Output sind Odds Ratios mit 95-%-KI — direkt klinisch interpretierbar.
Faktorenanalyse
Wenn du eine eigene Skala validierst, brauchst du explorative oder konfirmatorische Faktorenanalyse zur Prüfung der dimensionalen Struktur. In R mit dem psych-Paket (fa()) oder lavaan für CFA. Komplexes Thema — bei Unsicherheit lohnt sich individuelle Beratung.
Online-Fragebögen: Besonderheiten
Bei Online-Surveys (LimeSurvey, SoSci, Google Forms, Qualtrics) gibt es zusätzliche Punkte, die in Papier-Fragebögen nicht relevant sind:
- Datenexport als CSV (kompatibler als Excel, robuster gegen Sonderzeichen)
- Bot-Filter: zu schnell beantwortete Surveys (< 1/3 der mittleren Bearbeitungszeit) ausschließen
- Straightlining: Personen, die alle Items mit "3" beantworten → Verdacht auf unaufmerksames Antworten, ausschließen
- Drop-out-Pattern: Wo brechen die meisten ab? Hinweis auf problematische Items
- Mobile vs. Desktop: Kann Antwortverhalten beeinflussen — als Kovariate erfassen
- IP-Doppelteinträge: Mehrere Antworten von derselben IP-Adresse identifizieren und ggf. ausschließen
Datenqualitäts-Audit vor der Auswertung
Bevor du in die Inferenzstatistik einsteigst, lohnt sich ein systematisches Audit:
Häufigkeiten anschauen
In SPSS: Analysieren → Deskriptive Statistiken → Häufigkeiten (für alle Variablen)
Auffälligkeiten:
- Werte außerhalb der Skala (z. B. q1 = 7, obwohl 1-5)
- Fehlende Werte > 10 % einer Variable → Variable ggf. ausschließen
- Sehr asymmetrische Verteilungen → Outlier prüfen
Vollständigkeit pro Person
Beobachtungen mit > 30 % fehlenden Antworten oft ausschließen. Listwise-Exklusion ist konservativ; paarweise Exklusion erhält mehr Daten, kann aber zu inkonsistenten N führen.
Plausibilität
Cross-Checks: Liegt das angegebene Alter im plausiblen Bereich? Sind Datumseingaben konsistent? Antworten Personen, die "nie" Sport treiben, gleichzeitig "5x pro Woche" trainieren?
Weitere Methodik-Artikel
Je nach Studiendesign brauchst du spezifische Vertiefungen:
- Likert-Skala richtig auswerten — wenn du Likert-Items oder Summenscores im Fragebogen nutzt
- SPSS Auswertung Schritt für Schritt — komplettes Tutorial für die Auswertung
- Wilcoxon-Mann-Whitney-Test — die wichtigste nicht-parametrische Alternative
- Promotion Statistik auswerten — wenn du den Fragebogen für deine Doktorarbeit auswertest
- Qualitative Inhaltsanalyse nach Mayring — wenn dein Fragebogen freie Textantworten enthält
Zusammenfassung
Die Auswertung eines Fragebogens folgt einem klaren Ablauf: Dateneingabe und Codierung, Datenbereinigung, deskriptive Statistik, Skalenbildung mit Reliabilitätsprüfung, Hypothesentests, ggf. multivariate Analysen und Ergebnisdarstellung. Die Software-Wahl (Excel für einfache Deskription, SPSS für den Standard, R für Fortgeschrittene) hängt von der Komplexität deiner Analyse ab.
Der wichtigste Tipp: Plane die Auswertung vor der Datenerhebung. Wer den Fragebogen erst nach dem Ausfüllen analysiert, merkt oft zu spät, dass die falschen Fragen gestellt wurden.
Du brauchst professionelle Hilfe bei der Auswertung deines Fragebogens? Unsere Biostatistik & Forschungsanalyse übernimmt die vollständige Fragebogenauswertung — vom Fragebogendesign über die statistische Analyse bis zum fertigen Ergebnisteil. Kostenloses Erstgespräch.
Häufige Fragen
„Wie werte ich einen Fragebogen richtig aus?" → Du gehst systematisch vor: Dateneingabe, Skalenniveaus prüfen, deskriptive Statistiken berechnen, fehlende Werte behandeln und dann Hypothesen testen. Dieser Leitfaden führt dich Schritt für Schritt durch den gesamten Prozess.
„Welche Software ist am besten für Fragebogenauswertung?" → Excel eignet sich für einfache Auswertungen, SPSS ist benutzerfreundlich und weit verbreitet, R bietet maximale Flexibilität. Die beste Wahl hängt von deinen Anforderungen und deiner Erfahrung ab.
„Wie gehe ich mit fehlenden Antworten um?" → Du dokumentierst fehlende Werte zunächst, analysierst ihr Ausmaß und entscheidest dann: ignorieren, ausschließen oder imputieren. Bei weniger als 5 % fehlenden Daten reicht oft der komplette Fallausschluss aus.
„Welche statistischen Tests brauche ich für meinen Fragebogen?" → Das hängt von deinem Skalenniveau und deinen Hypothesen ab: Nominaldaten benötigen Chi-Quadrat-Tests, Ordinaldaten Mann-Whitney-U-Tests, metrische Daten t-Tests oder ANOVA. Dein Fragebogendesign bestimmt die passenden Verfahren.
🔬 Teste dein Wissen zu diesem Thema
MC-Fragen nach IMPP-Katalog mit Erklärungen zu jeder Antwortoption. Von Ärzten geprüft.
14 Tage kostenlos testen Keine Kreditkarte erforderlich