Promotion Statistik auswerten: Planung, Methoden & Hilfe
Statistik für die Promotion richtig planen und auswerten: Welche Methoden brauchen Sie, wann sollten Sie beginnen und wann lohnt sich professionelle Hilfe? Praxisleitfaden von Biostatistikern der Unikliniken.
Die statistische Auswertung ist der Punkt in der Promotion, an dem aus Rohdaten Ergebnisse werden — und gleichzeitig der Punkt, an dem die meisten Doktoranden ins Stocken geraten. Nicht weil die Daten schlecht sind, sondern weil die Frage "Welchen Test nehme ich jetzt?" ohne methodische Grundlage kaum zu beantworten ist.
Dieser Leitfaden erklärt, wie Sie die Statistik Ihrer Promotion von Anfang an richtig planen, welche Methoden für welche Fragestellungen geeignet sind und wann professionelle Unterstützung sinnvoll wird.
Warum die statistische Planung an den Anfang gehört
Der häufigste Fehler bei Promotionen: Die Daten werden erhoben, und erst danach stellt sich die Frage, wie man sie auswertet. Das Ergebnis sind fehlende Variablen, unpassende Skalenniveaus und Stichproben, die für die geplante Analyse zu klein sind.
Die statistische Planung gehört in die Exposé-Phase — idealerweise noch vor dem Ethikantrag. Denn die Ethikkommission erwartet eine schlüssige statistische Begründung: Welche Tests planen Sie? Wie viele Patienten brauchen Sie? Wie gehen Sie mit fehlenden Werten um?
Merke: Wer die Statistik erst plant, wenn die Daten vorliegen, hat oft die falschen Variablen gemessen. Die Auswertung beginnt nicht nach der Erhebung — sie beginnt vor der Erhebung.
Die 5 Phasen der statistischen Auswertung in der Promotion
Phase 1: Studiendesign und Hypothesenformulierung
Bevor Sie eine einzige Zahl erheben, müssen drei Fragen beantwortet sein:
Was ist Ihre primäre Fragestellung? Formulieren Sie eine klare, überprüfbare Hypothese. "Gibt es einen Unterschied in der Komplikationsrate zwischen Gruppe A und Gruppe B?" ist testbar. "Wir wollen untersuchen, ob das Verfahren gut ist" ist es nicht.
Was ist Ihr primärer Endpunkt? Die Variable, an der sich Erfolg oder Misserfolg Ihrer Studie entscheidet. Bei einer klinischen Studie könnte das die 30-Tage-Mortalität sein, bei einer Umfrage der Summenscore eines validierten Fragebogens.
Welches Studiendesign verwenden Sie? Retrospektiv, prospektiv, experimentell? Querschnitt oder Längsschnitt? Randomisiert oder beobachtend? Das Design bestimmt die statistischen Methoden. Mehr dazu im Artikel zu den Doktorarbeit-Typen in der Medizin.
Phase 2: Fallzahlplanung (Power-Analyse)
Die Fallzahlplanung beantwortet die Frage: "Wie viele Teilnehmer brauche ich, um einen klinisch relevanten Effekt statistisch nachweisen zu können?"
Ohne Power-Analyse riskieren Sie zwei Szenarien: Ihre Studie ist zu klein und findet keinen Effekt, obwohl einer existiert (Fehler 2. Art). Oder Ihre Studie ist unnötig groß, was Ressourcen verschwendet und ethisch problematisch sein kann.
Was Sie für die Power-Analyse brauchen: Die erwartete Effektstärke (aus Vorstudien oder Literatur), das gewünschte Signifikanzniveau (typischerweise α = 0,05), die gewünschte Power (typischerweise 80% oder 90%), und die Art des statistischen Tests.
Tools: G*Power (kostenlos und der Standard für akademische Arbeiten), nQuery oder R (Pakete pwr und samplesize). SPSS selbst bietet keine integrierte Power-Analyse.
Merke: Die Ethikkommission erwartet eine Fallzahlplanung. Ohne Power-Analyse ist ein Ethikantrag unvollständig.
Phase 3: Datenerhebung und Datenmanagement
Während der Datenerhebung passieren die meisten vermeidbaren Fehler:
Datenstruktur vorab festlegen. Erstellen Sie ein Codebook: Welche Variable heißt wie? Welches Skalenniveau hat sie? Wie werden fehlende Werte codiert? Ein sauberes Codebook spart Wochen bei der späteren Auswertung.
Datenbank statt Excel. Für größere Studien (> 100 Fälle) ist eine strukturierte Datenbank (REDCap, OpenClinica) besser als eine Excel-Tabelle. Weniger Eingabefehler, automatische Plausibilitätsprüfungen, und die Daten sind sofort auswertungsbereit.
Regelmäßige Zwischenauswertungen. Prüfen Sie nach 20–30 Fällen, ob die Datenqualität stimmt: Gibt es systematisch fehlende Werte? Stimmen die Verteilungen? Gibt es offensichtliche Eingabefehler? Besser jetzt korrigieren als nach 200 Fällen.
Phase 4: Statistische Analyse
Die eigentliche Auswertung folgt einem systematischen Ablauf:
Schritt 1 — Datenbereinigung: Ausreißer identifizieren (Boxplot, z-Score > 3), fehlende Werte analysieren (zufällig fehlend vs. systematisch fehlend), und Plausibilitätsprüfung (ein BMI von 2,5 oder ein Alter von 250 sind Eingabefehler).
Schritt 2 — Deskriptive Statistik: Vor jedem Test kommt die Beschreibung. Mittelwert und Standardabweichung für normalverteilte metrische Daten, Median und Interquartilsabstand für nicht-normalverteilte Daten, absolute und relative Häufigkeiten für kategoriale Daten. Visualisierung mit Histogrammen, Boxplots und Balkendiagrammen.
Schritt 3 — Voraussetzungsprüfung: Jeder statistische Test hat Voraussetzungen. Normalverteilung (Shapiro-Wilk-Test), Varianzhomogenität (Levene-Test), ausreichende Zellbesetzung (bei Chi-Quadrat: erwartete Häufigkeit ≥ 5). Sind die Voraussetzungen verletzt, wechseln Sie zum nicht-parametrischen Alternativtest. Einen ausführlichen Entscheidungsbaum finden Sie im Artikel Statistik für die Doktorarbeit: Welcher Test wann?.
Schritt 4 — Inferenzstatistik: Jetzt kommen die eigentlichen Tests. Die häufigsten in Promotionen:
| Fragestellung | Normalverteilung | Test |
|---|---|---|
| Zwei unabhängige Gruppen vergleichen | Ja | Ungepaarter t-Test |
| Zwei unabhängige Gruppen vergleichen | Nein | Mann-Whitney-U-Test |
| Zwei abhängige Messungen vergleichen | Ja | Gepaarter t-Test |
| Zwei abhängige Messungen vergleichen | Nein | Wilcoxon-Test |
| Drei+ Gruppen vergleichen | Ja | ANOVA |
| Drei+ Gruppen vergleichen | Nein | Kruskal-Wallis-Test |
| Zusammenhang zweier metrischer Variablen | Ja | Pearson-Korrelation |
| Zusammenhang zweier metrischer Variablen | Nein | Spearman-Korrelation |
| Häufigkeiten vergleichen | — | Chi-Quadrat-Test |
| Einflussfaktoren identifizieren | — | Logistische Regression |
Schritt 5 — Effektstärke und Konfidenzintervall: Berichten Sie nicht nur den p-Wert. Klinische Relevanz zeigt sich in der Effektstärke (Cohen's d, Odds Ratio, relatives Risiko) und dem 95%-Konfidenzintervall. Immer beides angeben.
Phase 5: Ergebnisdarstellung
Die Ergebnisse müssen im Methodenteil und Ergebnisteil Ihrer Dissertation korrekt dargestellt werden:
Im Methodenteil: Beschreiben Sie alle verwendeten Tests, die Software (inkl. Version), das Signifikanzniveau und wie Sie mit multiplem Testen umgegangen sind.
Im Ergebnisteil: Beginnen Sie immer mit der deskriptiven Statistik (Tabelle 1: Baseline-Charakteristika). Dann die inferenzstatistischen Ergebnisse in der Reihenfolge Ihrer Hypothesen. Berichten Sie im APA-Format: "Die Komplikationsrate war in Gruppe A signifikant niedriger als in Gruppe B (12,3% vs. 28,7%, p = 0,003, OR = 0,34, 95%-KI: 0,17–0,68)."
Grafiken: Verwenden Sie Boxplots für Gruppenvergleiche, Kaplan-Meier-Kurven für Überlebensanalysen und Forest-Plots für Meta-Analysen. Keine 3D-Diagramme, keine Kuchendiagramme. Publikationsfertige Grafiken erstellen Sie mit R (ggplot2), GraphPad Prism oder SPSS.
Welche Software für die Promotion?
Die Wahl der richtigen Software hängt von Ihrer Fragestellung, Ihrem Fachbereich und Ihrer Vorerfahrung ab.
SPSS ist der Standard an medizinischen Fakultäten. Menügesteuert, intuitiv bedienbar, für die meisten Doktorarbeiten ausreichend. Nachteil: Lizenzkosten (prüfen Sie die Uni-Lizenz) und eingeschränkte Möglichkeiten bei fortgeschrittenen Analysen. Eine ausführliche Anleitung finden Sie im Artikel SPSS Hilfe: Anleitung für Einsteiger und Fortgeschrittene.
R / RStudio ist kostenlos und der Goldstandard in der Biostatistik. Alle denkbaren Analysemethoden verfügbar, reproduzierbare Analysen, publikationsfertige Grafiken. Nachteil: Lernkurve. Für Promovierende, die langfristig in der Forschung bleiben wollen, ist R die beste Investition.
Stata wird besonders in der Epidemiologie und klinischen Forschung verwendet. Guter Kompromiss zwischen menügesteuerter Bedienung und Programmierbarkeit. Kostenpflichtig.
Python (scikit-learn, statsmodels) gewinnt an Bedeutung — besonders wenn Machine-Learning-Methoden zum Einsatz kommen. Für klassische biostatistische Auswertungen ist R jedoch etablierter.
GraphPad Prism ist ideal für experimentelle Arbeiten mit überschaubarer Datenstruktur. Exzellente Grafiken, einfache Bedienung, aber limitiert bei komplexen multivariaten Analysen.
Die 5 häufigsten Statistik-Fehler in Promotionen
Fehler 1: p-Hacking. So lange verschiedene Tests ausprobieren, bis einer signifikant wird. Das ist nicht nur schlechte Wissenschaft — es kann als wissenschaftliches Fehlverhalten gewertet werden. Definieren Sie Ihre Tests vorab im statistischen Analyseplan.
Fehler 2: Multiples Testen ohne Korrektur. Wenn Sie 20 Tests gleichzeitig durchführen, ist die Wahrscheinlichkeit, mindestens ein falsch-positives Ergebnis zu finden, 64%. Nutzen Sie Bonferroni-Korrektur, Holm-Korrektur oder FDR-Adjustierung.
Fehler 3: Überinterpretation nicht-signifikanter Ergebnisse. "Es gab keinen signifikanten Unterschied" bedeutet nicht "Es gibt keinen Unterschied." Es kann auch bedeuten, dass Ihre Stichprobe zu klein war. Berichten Sie die Power Ihrer Studie.
Fehler 4: Korrelation als Kausalität. Eine Korrelation zwischen Variablen A und B sagt nichts über Ursache und Wirkung. Kausalaussagen erfordern experimentelle Designs oder fortgeschrittene kausale Inferenzmethoden.
Fehler 5: Fehlende Werte ignorieren. Wenn 20% Ihrer Daten fehlen, können Sie nicht einfach die Fälle mit fehlenden Werten löschen (listwise deletion). Das verzerrt Ihre Ergebnisse. Prüfen Sie den Fehlmechanismus (MCAR, MAR, MNAR) und verwenden Sie bei Bedarf multiple Imputation.
Wann lohnt sich professionelle Statistik-Hilfe?
Statistische Beratung ist kein Zeichen von Schwäche — sondern von methodischem Bewusstsein. Professionelle Hilfe lohnt sich besonders in diesen Situationen:
Komplexe Fragestellungen: Wenn Ihre Analyse Multilevel-Modelle, Überlebensanalysen mit zeitabhängigen Kovariaten, Propensity-Score-Matching oder Machine-Learning-Methoden erfordert.
Zeitdruck: Wenn die Abgabe naht und die Auswertung noch nicht abgeschlossen ist. Ein erfahrener Biostatistiker kann in wenigen Tagen erledigen, wofür Sie Wochen brauchen.
Publikationsvorbereitung: Wenn Sie Ihre Ergebnisse in einem hochrangigen Journal veröffentlichen wollen, muss die Statistik Reviewer-Qualität haben. Methodische Schwächen sind der häufigste Ablehnungsgrund.
Keine Vorerfahrung: Wenn Sie zum ersten Mal mit statistischer Software arbeiten und Ihr Betreuer selbst kein Statistik-Experte ist.
Gute Anlaufstellen: das Institut für Biometrie Ihrer Fakultät (bietet oft kostenlose Beratung), die statistischen Beratungsstellen der Uni, und spezialisierte Dienstleister für biostatistische Auswertungen.
Häufige Fragen
- „Wann sollte ich mit der statistischen Planung beginnen?" → Vor der Datenerhebung — idealerweise parallel zum Exposé. Die Ethikkommission erwartet eine statistische Begründung im Antrag.
- „Kann ich die Statistik meiner Promotion selbst machen?" → Für einfache Designs (retrospektive Studie mit Gruppenvergleich) ja, wenn Sie die Grundlagen beherrschen. Bei komplexen Designs oder Publikationsabsicht ist professionelle Hilfe empfehlenswert.
- „Reicht SPSS für meine Promotion?" → Für die meisten medizinischen Doktorarbeiten ja. Bei Machine-Learning, Multilevel-Modellen oder Bayesianischer Statistik brauchen Sie R oder Python.
- „Was kostet eine professionelle statistische Auswertung?" → Je nach Umfang und Komplexität variabel. Seriöse Anbieter bieten ein kostenloses Erstgespräch, in dem der Aufwand eingeschätzt wird.
- „Hilft mein Betreuer bei der Statistik?" → Das ist sehr unterschiedlich. Viele Betreuer sind exzellente Kliniker, aber keine Statistiker. Frage frühzeitig, ob die Arbeitsgruppe einen Biometriker hat.
- „Muss ich die Statistik in meiner Disputation erklären können?" → Ja. Die Methodik ist ein Kernthema der Disputation. Sie müssen jeden Test begründen können, auch wenn Sie ihn nicht selbst durchgeführt haben.
Zusammenfassung
Die Statistik der Promotion ist kein lästiges Anhängsel — sie ist das methodische Rückgrat Ihrer Forschung. Planen Sie die Auswertung vor der Datenerhebung, führen Sie eine Power-Analyse durch, wählen Sie die richtigen Tests systematisch aus (Skalenniveau → Normalverteilung → Gruppenanzahl) und berichten Sie immer Effektstärke und Konfidenzintervall — nicht nur den p-Wert.
Sie brauchen professionelle Unterstützung bei der Statistik Ihrer Promotion? Unsere Biostatistik & Forschungsanalyse bietet Ihnen professionelle statistische Auswertung — von der Studienplanung bis zur publikationsfertigen Ergebnisdarstellung. Kostenloses Erstgespräch vereinbaren.
🔬 Teste dein Wissen zu diesem Thema
MC-Fragen nach IMPP-Katalog mit Erklärungen zu jeder Antwortoption. Von Fachärzten geprüft.
14 Tage kostenlos testen Keine Kreditkarte erforderlich