Key points are not available for this paper at this time.
요약 통계 모델의 사용 증가 비정규 데이터, 일반화 선형 모델(GLM) 및 일반화 선형 혼합 모델(GLMM)과 같은 전통적인 데이터 변환 및 최소 제곱 선형 모델(LM)을 적용하는 접근 방식을 밀어내고 있습니다. 그럼에도 불구하고 많은 최소 제곱 통계 테스트는 잔차의 합의 분산에 의존하며, 이는 중심 극한 정리에 의해 대규모 샘플 크기에서 정규 분포로 수렴합니다. 따라서 최소 제곱 LM은 회귀 계수의 통계적 유의성을 평가하는 데 좋은 성능을 보일 가능성이 높습니다. 카운트 데이터의 시뮬레이션을 사용하여 회귀 계수와 제로가 다른지 테스트하기 위한 GLM 접근 방식을 전통적인 LM을 변환된 데이터에 적용한 방식과 비교했습니다. 시뮬레이션은 샘플 모집단 간 변동성이 (i) 음이항 또는 (ii) 로그-정규 포아송(즉, 포아송 분포에 의해 샘플링된 모집단 간 로그-정규 변동) 중 하나라고 가정했습니다. 시뮬레이션된 데이터를 사용하여 회귀 계수가 제로와 다르다는 가설의 검정을 수행했습니다. 계수 추정기의 통계적 특성, 편향 및 정밀도와 같은 것은 조사하지 않았습니다. GLM과 밀접하게 일치하는 가정의 음이항 시뮬레이션의 경우, GLM은 예외적으로 하나 이상의 예측(독립) 변수가 있을 때 유의미한 제I종 오류(거짓 긍정)에 취약했습니다. 그러나 제I종 오류를 수정하면 GLM이 LM보다 약간 더 나은 통계적 파워를 제공했습니다. 로그-정규-포아송 시뮬레이션의 경우, GLMM와 LM 모두 잘 수행되었지만, 일부 시뮬레이션 조건에서는 GLM의 제I종 오류율이 높았고, 이는 통계 테스트에서 치명적인 오류입니다. 이 결과는 GLM이 제대로 명시된 경우 파워에서 약간의 장점이 있지만, 잘못 지정될 경우 회귀 계수의 유의성에 대한 잘못된 결론으로 이어질 수 있음을 보여줍니다. 반면, 데이터를 변환하고 최소 제곱 선형 분석을 적용하는 전통적인 접근 방식은 광범위한 조건에서 유의성에 대한 강력한 통계 테스트를 제공합니다. 따라서 데이터를 변환하고 LM을 적용하는 전통적인 접근 방식은 여전히 유용합니다.
앤서니 R. 아이브스(Anthony R. Ives, Sat) 이 문제를 연구했습니다.