In dieser Arbeit reflektieren wir die Herausforderungen bei der Durchführung von Tests zur Konditionalen Unabhängigkeit (Conditional Independence Testing, CI) für nicht-i.i.d. Daten, wie erhöhte Typ-I-Fehler und verringerte Teststärke bei wiederholten Messungen. Unsere Untersuchung hebt das erweiterte GCM (EGCM) hervor, das das Potenzial besitzt, die Komplexität von Daten mit Zufallseffekten bei wiederholten Messungen zu bewältigen, mit denen traditionelle CI-Tests oft Probleme haben. Die Forschung wird durch die Notwendigkeit motiviert, CI-Testmethoden für nicht-i.i.d. Daten bei wiederholten Messungen, wie im ADNI-Datensatz, zu verbessern. Dies ist wichtig für Fortschritte in der medizinischen Diagnostik, wo das Verständnis der Abhängigkeiten zwischen Biomarkern für Krankheitsdetektion entscheidend ist. Das Hauptziel ist, einen CI-Testansatz zu entwickeln und zu validieren, der die spezifischen Herausforderungen nicht-i.i.d. Daten bewältigt. Das EGCM wird als Lösung vorgeschlagen, um genauere und zuverlässigere Tests für Datensätze mit wiederholten Messungen und Zufallseffekten zu ermöglichen. Die Dissertation untersucht CI-Tests, einschließlich metrikbasierter, kernelbasierter, simulationsbasierter und regressionsbasierter Tests, und zeigt deren Vielfalt bei der Erfassung konditionaler Abhängigkeiten. Das GCM bietet eine Lösung für nicht-i.i.d. Daten, basierend auf einem regressionsbasierten Ansatz, der domänenspezifische Regressionsmethoden integriert. Durch Regression von Variablen gegen eine Konditionierungsmenge und Untersuchung der Kovarianz der Residuen zeigt GCM Anpassungsfähigkeit an unterschiedliche Datenkontexte. Ein Beispiel mit wiederholten Messungen und zufälligem Intercept zeigt, dass Standard-GCM in solchen Fällen scheitern kann, was zu erhöhten Typ-I-Fehlern und verringerter Teststärke führt. Das EGCM erweitert das GCM, um Zufallseffekte in wiederholten Messdaten zu berücksichtigen. Durch Untersuchung von Mischmodellen für nicht-i.i.d. wiederholte Messungen wählen wir GAMMs, um das GCM zu erweitern, da sie Abhängigkeiten und nichtlineare Beziehungen modellieren können. Die Studie führt Simulationsstudien durch, um die Wirksamkeit des EGCM zu bewerten, indem es mit dem GCM in verschiedenen Szenarien verglichen wird. Die Simulationen sind so gestaltet, dass sie Bedingungen linearer und nichtlinearer Beziehungen, Zufallseffekte und synthetischer Datensätze nachahmen. Die Ergebnisse heben die Überlegenheit des EGCM bei der genauen Erkennung von CI hervor, besonders bei wiederholten Messungen mit Zufallseffekten. Durch Anwendung des EGCM auf reale ADNI-Daten übersetzt die Dissertation eine komplexe medizinische Frage in ein statistisches CI-Testproblem. Das EGCM erweist sich als effektiv, um signifikante Zusammenhänge zwischen MRI-Markern und der frühen AD-Diagnose aufzudecken, die über kognitive Tests hinausgehen. Die Fähigkeit des EGCM, relevante MRI-Marker für die frühe AD-Diagnostik zu identifizieren, hat bedeutende Implikationen für die medizinische Forschung und Praxis.
Qingzi Huo (Mon,) studied this question.