Key points are not available for this paper at this time.
Abstract Ökologen und evolutionäre Biologen werden regelmäßig mit dem Vergleich von binären Daten über Gruppen hinweg beauftragt. Es gibt jedoch Diskussionen in der biostatistischen Literatur über die beste Methodik zur Analyse von Daten, die binäre erklärende und Antwortvariablen bilden und eine 2 × 2 Kontingenztabelle bilden. Wir bewerten mehrere Methoden zur Analyse von 2 × 2 Kontingenztabellen mithilfe eines Simulationsschemas mit unterschiedlichen Stichprobengrößen, bei denen die Ergebnisse gleichmäßig oder ungleichmäßig zwischen den Gruppen verteilt sind. Insbesondere bewerten wir die allgemein empfohlene logistische (generalisiertes lineares Modell GLM) Regressionsanalyse, den klassischen Pearson-Chi-Quadrat-Test und vier konventionelle Alternativen (Yates' Korrektur, Fisher's exakt, exakt bedingungslos und mid-p), sowie das weithin nicht empfohlene lineare Modell (LM) Regression. Wir stellten fest, dass sowohl LM- als auch GLM-Analysen unverzerrte Schätzungen des Unterschieds in den Anteilen zwischen Gruppen lieferten. LM- und GLM-Analysen lieferten auch genaue Standardfehler und Konfidenzintervalle, wenn das experimentelle Design ausgewogen war. Wenn das experimentelle Design unausgewogen war, die Stichprobengröße klein war und eine der beiden Gruppen eine Wahrscheinlichkeit nahe 1 oder 0 hatte, konnte die LM-Analyse die statistische Unsicherheit erheblich über- oder unterrepräsentieren. Für die Signifikanzprüfung der Nullhypothese war die Leistung des Chi-Quadrat-Tests und der LM-Analyse nahezu identisch. In allen Szenarien hatten beide eine hohe Power, um nicht-null Effekte zu erkennen und falsch positive Ergebnisse abzulehnen. Im Gegensatz dazu war die GLM-Analyse unterpowered, wenn z-basierte p-Werte verwendet wurden, insbesondere wenn eine der beiden Gruppen eine Wahrscheinlichkeit nahe 1 oder 0 hatte. Das GLM unter Verwendung des LRT hatte eine bessere Power, um nicht-null Ergebnisse zu erkennen. Unsere Simulationsergebnisse deuten darauf hin, dass, wo immer ein Chi-Quadrat-Test empfohlen wird, eine lineare Regression eine geeignete Alternative zur Analyse von 2 × 2 Kontingenztabellendaten ist. Wenn Forscher sich für anspruchsvollere Verfahren entscheiden, stellen wir R-Funktionen zur Verfügung, um den Standardfehler eines Unterschieds zwischen zwei Wahrscheinlichkeiten aus einer Bernoulli-GLM-Ausgabe unter Verwendung der Delta-Methode zu berechnen. Wir erkunden auch Ansätze, um die GLM-Analyse von 2 × 2 Kontingenztabellen mit glaubwürdigen Intervallen auf der Wahrscheinlichkeits-Skala zu ergänzen. Diese zusätzlichen Operationen sollten Forschern helfen, gültige Einschätzungen sowohl der statistischen als auch der praktischen Signifikanz vorzunehmen.
Nagel et al. (Mon,) untersuchten diese Frage.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: