January 1, 2006

클래스 불균형 문제를 해결하는 방법으로 비용 민감 신경망 훈련

Key Points

Key points are not available for this paper at this time.

Abstract

이 논문은 비용 민감 신경망 훈련에서 샘플링과 임계값 이동의 효과를 실증적으로 연구한다. 과잉 샘플링과 부족 샘플링 모두 고려된다. 이러한 기술은 훈련 데이터의 분포를 수정하여 예제의 비용이 예제의 출현에 의해 명시적으로 전달되도록 한다. 임계값 이동은 출력 임계값을 저렴한 클래스 쪽으로 이동시키려 시도하여 더 높은 비용을 가진 예제가 잘못 분류되는 것을 더 어렵게 만든다. 또한, 하드 앙상블과 소프트 앙상블, 즉 하드 또는 소프트 투표 방식을 통해 위의 기술을 조합한 것도 테스트된다. 세 가지 유형의 비용 매트릭스가 있는 21개의 UCl 데이터 집합과 실제 세계의 비용 민감 데이터 집합이 실증 연구에 사용된다. 결과는 다중 클래스 작업에 대한 비용 민감 학습이 이중 클래스 작업보다 더 어렵고, 더 높은 정도의 클래스 불균형이 난이도를 증가시킬 수 있음을 시사한다. 또한 거의 모든 기술이 이중 클래스 작업에 효과적이지만, 대부분은 비효율적이며 다중 클래스 작업에서는 오히려 부정적인 영향을 미칠 수 있음을 밝혀냈다. 전반적으로, 임계값 이동과 소프트 앙상블은 비용 민감 신경망 훈련에서 상대적으로 좋은 선택이다. 실증 연구는 또한 클래스 불균형 문제를 해결하는 데 효과적이라고 여겨졌던 몇 가지 방법이 사실상 불균형 이중 클래스 데이터 집합 학습에만 효과적일 수 있음을 제안한다.

Bookmark

클래스 불균형 문제를 해결하는 방법으로 비용 민감 신경망 훈련

Key Points

Abstract

Cite This Study

Also Consider

Also Consider