July 26, 2022Open Access

정규화된 심층 신경망을 이용한 저자 후속 귀속

Key Points

Key points are not available for this paper at this time.

Abstract

저자 후속 귀속은 이메일, 블로그, 포럼 게시물 또는 채팅 기록과 같은 온라인 텍스트 스니펫의 진정한 저자를 식별하기 위해 스타일 메트릭 기능을 사용하는 과학적 과정입니다. 이는 성차별적, 남성혐오적, 외국인 혐오적 및 폭력적인 게시물을 사전에 탐지하기 위한 검증 과정에서 유용한 응용 프로그램을 가지고 있습니다. 이 과정은 텍스트가 저자의 기능적 및 내용적 스타일을 집합적으로 나타내는 단어 시퀀스에 의해 특징지어질 수 있다고 가정합니다. 그러나 저자의 독특한 글쓰기 스타일을 포착하기 위한 적절한 텍스트 특성 정의는 계산 언어학 분야에서 복잡한 작업입니다. 또한 게시물은 일반적으로 저자에 대한 특징적인 귀속 정확성에 영향을 줄 수 있는 혼란스러운 어휘를 가진 짧은 텍스트입니다. 이 어휘에는 관용구, 의성어, 동음이의어, 음소, 동의어, 약어, 대명사 및 다의어가 포함됩니다. 이 논문에서는 저자 후속 귀속의 내재적 문제를 극복하기 위해 정규화된 심층 신경망(RDNN) 방법을 소개합니다. 이 방법은 합성곱 신경망, 양방향 장기 단기 메모리 인코더 및 분산 고속도로 네트워크에 기반합니다. 신경망은 양방향 인코더에 공급되어 구문적 특성 벡터 표현을 추출하는 Lexical 스타일 메트릭 기능을 추출하는 데 사용되었습니다. 그런 다음 이 특징 벡터는 네트워크 일반화 오류를 최소화하기 위한 정규화를 위해 분산 고속도로 네트워크에 입력으로 제공되었습니다. 최종적으로 정규화된 특징 벡터는 저자의 글쓰기 스타일을 학습하기 위해 양방향 디코더에 전달되었습니다. 특성 분류 층은 예측을 위한 완전 연결 네트워크 및 SoftMax 함수로 구성됩니다. RDNN 방법은 성과를 검증하기 위해 4개의 벤치마크 실험 데이터 세트를 사용하여 13개의 최첨단 방법과 비교하여 테스트되었습니다. 실험 결과는 세 개의 데이터 세트에서 기존의 최첨단 방법들과 비교했을 때 이 방법의 효과를 입증했으며, 한 개의 데이터 세트에서 비슷한 결과를 산출했습니다.

Bookmark

View Full Paper

Bookmark

View Full Paper

정규화된 심층 신경망을 이용한 저자 후속 귀속

Key Points

Abstract

Cite This Study