본 연구는 최신 텍스트 마이닝 기법인 BERTopic 알고리즘을 활용하여, 최근 15년간 중국 동북지역 선사시대 고고학의 거시적인 연구 동향과 학술 주제의 지형도를 객관적으로 규명하는 것을 목적으로 한다. 이에 본 연구는 중국지왕(CNKI) 등에서 수집된 핵심 문헌들을 1차 사료인 ‘발굴 약보고서(简报)’와 2차 해석 자료인 ‘학술 논문’으로 분리하여 텍스트 전처리 및 토픽 모델링을 수행하였다. 분석 결과, 발굴 약보고서 군집에서는 과거 요서(辽⻄) 지역에 집중되었던 현장 발굴의 무게중심이 최근 길림성과 흑룡강성 등 동북 북부 지역의 신석기시대 유적으로 이동하는 유의미한 변화가 간취되었다. 나아가 학술 논문에 대한 BERTopic 분석 및 계층적 토픽 모델링을 수행한 결과, 파편화된 세부 연구 주제들이 궁극적으로 세 개의 거대한 학술적 뿌리로 수렴하는데, 첫째, 발굴 출토 자료에 기반하여 동북 지역의 선사 문화를 해석해 내는 ‘전통 고고학’ 담론이다. 둘째, 홍산문화 연구 및 청동기시대 적석 묘제로 연결되는 요서 지역 중심의 광역적 물질문화 ‘교류사’이다. 셋째, 다학제적 자연과학 분석을 동반한 ‘생업 경제’ 연구의 자립이다. 특히 동물고고학과 고환경 복원을 아우르는 과기고고(科技考古)적 접근이 중국 동북 고고학계 내에서 독립적이고 확고한 주류 학문 분과로 안착했음을 AI 알고리즘을 통해 살펴볼 수 있었다. 본 연구는 단순히 정량적인 키워드 도출에 그치지 않고, 기계적 군집화 이면에 숨겨진 고고학적 맥락을 인문학자의 시각으로 재구축해야 함을 역설하였다. 자료 수집 단계부터 데이터 전처리 과정, 토픽 알고리즘 설정, 최종 분석에 이르기까지 전 과정에 걸쳐 해당 분야 전문가의 개입이 필수적임을 역설하였다.
Kim et al. (Thu,) studied this question.