A Bivariate Zero-Inflated Negative Binomial Regression Model Based on the Sarmanov Family
Abstract
본 연구에서는 이변량 영과잉 개수 자료를 분석하기 위하여 사르마노프 분포족을 활용한 이변량 영과잉 음이항(SBZINB) 회귀모형을 제안하였다. SBZINB 모형은 Lee, Jung(2021)이 제안한 사르마노프 분포족 기반의 이변량 음이항 모형에 근거한 모형으로 (0, 0) 셀 과잉과 두 반응변수의 이질적 산포를 동시에 고려할 수 있고, 두 반응변수 간 음(–)의 상관까지 허용하는 더욱 일반적인 모형이다. 본 연구에서 제안된 모형의 성능을 기존의 BZIP, SBZIP 및 BZINB 모형과 모의실험을 이용하여 비교하였다. 모의실험 결과 두 반응변수의 산포 차이가 큰 경우 SBZINB 모형은 기존 모형들보다 현저히 우수한 성능을 보였다. 반면 두 반응변수의 산포가 동일한 경우에도 SBZINB 모형의 적합도는 크게 떨어지지 않았다. 더불어 2021년 한국의료패널조사 자료를 이용한 사례분석 결과, AIC 기준에서는 SBZINB 모형이 가장 우수한 적합도를 보였고, BIC 기준에서는 BZINB 모형이 아주 근소하게 우수한 값을 나타냈다. 이는 두 반응변수의 산포 차이가 크지 않았을 때 단일 산포모수를 사용하는 BZINB 모형도 경쟁력 있는 대안이 될 수 있음을 시사한다. 그러나 다양한 상관 구조와 산포의 이질성을 동시에 반영할 수 있다는 점에서 SBZINB 모형은 기존 모형보다 일반적이고 유연한 분석 모형으로 볼 수 있으며, 관련 자료를 분석하는 다양한 연구 분야에서 효과적으로 활용될 수 있을 것으로 생각된다.
Key Points
Objective
This research aims to develop a bivariate zero-inflated negative binomial regression model utilizing the Sarmanov family.
Methods
- Proposed the SBZINB model based on the Sarmanov distribution
- Compared SBZINB with existing models using simulation studies
- Analyzed real data from the 2021 Korean Medical Panel Survey
Results
- SBZINB model showed significantly better performance with high variance in response variables
- SBZINB maintained adequate fit even with similar variance in response variables
- AIC indicated SBZINB as the best fitting model, while BZINB was slightly better based on BIC