Diese Masterarbeit repliziert und erweitert die Studie von Fukase et al. (2021), die Depression, Risikofaktoren und Bewältigungsstrategien während der zweiten Welle der COVID-19-Pandemie in Japan untersuchte. Unter Verwendung des öffentlich verfügbaren Datensatzes konnten die deskriptiven und inferenzstatistischen Analysen der Originalstudie erfolgreich reproduziert werden, mit nur geringfügigen Abweichungen, die wahrscheinlich auf Rundungsdifferenzen oder unterschiedliche Software zurückzuführen sind. Im Zuge der Replikation wurden nicht dokumentierte analytische Entscheidungen identifiziert, wie der Ausschluss von mehr als einem Fünftel der Teilnehmenden sowie mehrerer Bewältigungsstrategien, was die Bedeutung transparenter Dokumentation unterstreicht. Über die Replikation hinaus wendet diese Arbeit ein Machine-Learning-Framework auf denselben Datensatz an. Logistische und lineare Regressionsmodelle wurden in einer prädiktiven Pipeline mit verschachtelter Kreuzvalidierung und Hyperparameter-Optimierung implementiert und ihre Leistung mit Gradient Boosted Decision Trees (LightGBM) verglichen. Die Ergebnisse zeigen, dass die LightGBM-Modelle moderate, aber konsistente Verbesserungen der Vorhersagegenauigkeit im Vergleich zu den traditionellen Regressionsmodellen erzielen konnten. Die Ergebnisse stärken das Vertrauen in die ursprüngliche Studie, verdeutlichen die methodischen Abwägungen zwischen traditionellen statistischen und modernen Machine-Learning-Ansätzen und betonen den Wert der Integration strenger Replikationspraktiken mit prädiktiver Modellierung. Diese Arbeit leistet somit einen Beitrag sowohl zur Zuverlässigkeit
Julian Weinhuber (Thu,) studied this question.