Key points are not available for this paper at this time.
소셜 미디어에서 자동 증오 발언 탐지의 주요 도전 과제는 증오 발언과 다른 공격적인 언어의 사례를 구분하는 것입니다. 어휘적 탐지 방법은 특정 용어를 포함하는 모든 메시지를 증오 발언으로 분류하기 때문에 정확도가 낮은 경향이 있습니다. 감독 학습을 사용한 이전 연구는 두 범주를 구별하는 데 실패했습니다. 우리는 증오 발언 키워드를 포함하는 트윗을 수집하기 위해 군중 소싱된 증오 발언 어휘집을 사용했습니다. 우리는 이 트윗 샘플을 증오 발언을 포함하는 것, 공격적인 언어만 포함하는 것, 그리고 둘 다 포함하지 않는 것으로 세 가지 범주로 레이블링하기 위해 군중 소싱을 사용합니다. 우리는 이러한 서로 다른 범주를 구별하기 위해 다중 클래스 분류기를 훈련시킵니다. 예측 및 오류에 대한 면밀한 분석은 우리가 증오 발언을 다른 공격적인 언어로부터 신뢰성 있게 구분할 수 있는 시점과 이러한 구분이 더 어려운 경우를 보여줍니다. 우리는 인종 차별적이고 동성애 혐오적인 트윗이 증오 발언으로 분류될 가능성이 더 높지만, 성 차별적인 트윗은 일반적으로 공격적으로 분류된다는 것을 발견했습니다. 명시적인 증오 키워드가 없는 트윗도 분류하기가 더 어렵습니다.
Davidson et al. (Sat,) 이 질문을 연구했습니다.