대기 오염은 전 세계적으로 가장 중요한 환경적 문제 중 하나가 되었으며, 인체 건강, 기후 변화 및 전반적인 생태 균형에 상당한 영향을 미치고 있습니다. 빠른 산업화, 도시화 및 증가된 차량 배출량으로 인해 입자상 물질(PM2.5 및 PM10), 일산화탄소(CO), 이산화질소(NO₂), 이산화황(SO₂) 및 오존(O₃)과 같은 대기 오염 물질이 급격히 증가했습니다. 대기 오염 수준의 정확한 예측은 효과적인 통제 조치를 시행하고, 대중의 인식을 개선하며, 정책 결정 지원에 필수적입니다. 이 프로젝트는 역사적 및 실시간 환경 데이터를 사용하여 대기 오염 수준을 예측하기 위한 기계 학습 기반 예측 시스템의 개발에 중점을 두고 있습니다. 제안된 시스템은 선형 회귀, 결정 트리, 랜덤 포레스트, 서포트 벡터 머신(SVM) 및 인공 신경망(ANN)과 같은 다양한 기계 학습 알고리즘을 활용하여 다양한 오염 지표와 기상 매개변수 간의 패턴 및 관계를 분석합니다. 이 연구에서 사용된 데이터 세트는 정부 오염 통제 위원회 및 환경 모니터링 기관과 같은 신뢰할 수 있는 출처에서 수집되었습니다. 결측값 처리, 정규화 및 특징 선택과 같은 데이터 전처리 기술을 적용하여 모델 성능과 정확성을 향상시킵니다. 대기 오염 데이터의 추세 및 상관 관계를 파악하기 위해 탐색적 데이터 분석(EDA)이 수행됩니다.
Ravi 등(Thu,)이 이 문제를 연구했습니다.