What question did this study set out to answer?

This study aims to replicate findings on depression and its risk factors during the COVID-19 pandemic in Japan while introducing machine learning techniques for analysis.

April 24, 2026Open Access

Assessing risk factors for depression during the second wave of COVID-19 in Japan

Puntos clave

This study aims to replicate findings on depression and its risk factors during the COVID-19 pandemic in Japan while introducing machine learning techniques for analysis.
Replicated the study by Fukase et al. using a publicly available dataset.
Implemented logistic regression and gradient boosted decision trees with cross-validation.
Identified undocumented analytical decisions during the replication process.
LightGBM models showed moderate improvements in prediction accuracy compared to traditional regression models.
Reproduction of original study findings with minor deviations reinforces the reliability of the data.
Emphasized the importance of transparency in analytical decisions.

Resumen

Diese Masterarbeit repliziert und erweitert die Studie von Fukase et al. (2021), die Depression, Risikofaktoren und Bewältigungsstrategien während der zweiten Welle der COVID-19-Pandemie in Japan untersuchte. Unter Verwendung des öffentlich verfügbaren Datensatzes konnten die deskriptiven und inferenzstatistischen Analysen der Originalstudie erfolgreich reproduziert werden, mit nur geringfügigen Abweichungen, die wahrscheinlich auf Rundungsdifferenzen oder unterschiedliche Software zurückzuführen sind. Im Zuge der Replikation wurden nicht dokumentierte analytische Entscheidungen identifiziert, wie der Ausschluss von mehr als einem Fünftel der Teilnehmenden sowie mehrerer Bewältigungsstrategien, was die Bedeutung transparenter Dokumentation unterstreicht. Über die Replikation hinaus wendet diese Arbeit ein Machine-Learning-Framework auf denselben Datensatz an. Logistische und lineare Regressionsmodelle wurden in einer prädiktiven Pipeline mit verschachtelter Kreuzvalidierung und Hyperparameter-Optimierung implementiert und ihre Leistung mit Gradient Boosted Decision Trees (LightGBM) verglichen. Die Ergebnisse zeigen, dass die LightGBM-Modelle moderate, aber konsistente Verbesserungen der Vorhersagegenauigkeit im Vergleich zu den traditionellen Regressionsmodellen erzielen konnten. Die Ergebnisse stärken das Vertrauen in die ursprüngliche Studie, verdeutlichen die methodischen Abwägungen zwischen traditionellen statistischen und modernen Machine-Learning-Ansätzen und betonen den Wert der Integration strenger Replikationspraktiken mit prädiktiver Modellierung. Diese Arbeit leistet somit einen Beitrag sowohl zur Zuverlässigkeit

Leer artículo completoexternamente

Me gusta

Guardar

Ver artículo completo