Key points are not available for this paper at this time.
비구조적인 온라인 소스(예: 블로그 및 기사)에서 사이버 보안 정보를 자동적이고 적시에 더 형식적인 표현으로 변환하는 것은 현재 이 분야의 많은 애플리케이션에 필수적입니다. 명명된 개체 인식(NER)은 이러한 목표를 향한 초기 단계 중 하나입니다. 이는 기술 문서에서 제품, 버전, 공격 이름 등과 같은 관련 도메인 개체를 탐지하는 것과 관련됩니다. 정보 추출 분야에서는 일반적으로 간단한 작업으로 간주되지만, 사이버 보안과 같은 일부 도메인에서는 개체의 복잡한 구조 때문에 상당히 도전적입니다. 최신 기술 방법은 개체의 속성, 문맥, 도메인 지식 및 언어적 특성을 설명하는 시간 소모적이고 노동 집약적인 특징 공학을 요구합니다. 본 논문에서 설명한 모델은 도메인 독립적이며 사이버 보안 도메인에서 개체에 특정한 어떠한 특징에도 의존하지 않기 때문에 특징 공학을 수행하는데 전문가 지식이 필요하지 않습니다. 사용된 방법은 장기 단기 기억(Long Short-Term Memory, LSTM)이라는 유형의 순환 신경망과 조건부 확률 필드(Conditional Random Fields, CRFs) 방법에 의존합니다. 우리가 얻은 결과는 주석이 달린 상당한 크기의 말뭉치를 고려할 때 이 방법이 최신 기술 방법보다 더 우수하다는 것을 보여주었습니다.
Gasmi et al. (Fri,)은 이 질문을 연구했습니다.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: