Key points are not available for this paper at this time.
시계열 텍스트 마이닝(Temporal Text Mining, TTM)은 시간이 지남에 따라 수집된 텍스트 정보에서 시간적 패턴을 발견하는 데 관한 것이다. 대부분의 텍스트 정보에는 일부 시간 스탬프가 포함되어 있으므로, TTM은 뉴스 기사에서 이벤트 요약, 과학 문헌에서 연구 동향을 드러내는 등 여러 분야에서 많은 응용 프로그램이 있다. 이 논문에서는 특정 TTM 작업인 텍스트 스트림에서 테마의 진화 패턴을 발견하고 요약하는 것을 연구한다. 우리는 이 새로운 텍스트 마이닝 문제를 정의하고, (1) 텍스트에서 잠재적인 테마 발견하기, (2) 테마의 진화 그래프 구성하기, (3) 테마의 생애 주기 분석하기를 통해 이 문제를 해결하기 위한 일반적인 확률적 방법을 제시한다. 두 가지 서로 다른 분야(즉, 뉴스 기사와 문헌)에서 제안된 방법을 평가한 결과, 제안된 방법이 흥미로운 진화 테마 패턴을 효과적으로 발견할 수 있음을 보여준다.
Mei et al. (Sun,)은 이 질문을 조사했다.