본 연구는 국립국어원이 구축·관리하는 개방형 디지털 사전 『우리말샘』을 대상으로, 한자어의 형태적 특성과 혼성 양상을 계량적으로 분석하였다. 원어 정보에 한자가 하나 이상 포함된 표제어 447,595건을 추출하여, (1) 순한자어, (2) 한자+고유어 혼종어, (3) 한자+외래어 혼종어, (4) 복합형 혼성어의 네 범주로 규칙 기반 분류한 뒤, 음절 길이 분포, 후행 결합을 보이는 생산적 한자 성분, 고빈도 중심 형태소 등의 구조적 특징을 살폈다. 분석 결과, 순한자어가 전체의 약 71%를 차지하여 여전히 한자어가 한국어 어휘 체계의 중심을 이루고 있음을 확인하였다. 특히 2음절 한자어가 가장 높은 빈도를 보였으며, 3음절 이상은 상대적으로 적으나 전문 분야 어휘에서 주로 나타났다. 또한 ‘적(的)’, ‘성(性)’, ‘화(化)’, ‘자(者)’ 등 후행 결합이 빈번한 한자 성분은 접미사적 기능을 수행하며, 현대 한국어의 어휘 확장에 지속적으로 관여하고 있었다. 혼성어의 경우, 한자+고유어 혼종어가 약 24%로 가장 높은 비중을 차지하여, 한자어가 외래 요소의 직접 차용보다는 고유어와의 내부적 결합을 통해 의미 체계를 보완·정교화하는 경향을 보임을 확인하였다. 반면 한자+외래어 및 복합형 혼성어는 비율은 낮지만, 외래개념을 한국어 어휘 체계 안으로 단계적으로 재구조화하는 통로로 기능하였다. 이러한 결과는 한자어가 단순히 역사적 어휘 체계에 머무르지 않고, 현대 한국어에서도 형태적 안정성과 조어적 유연성을 동시에 지닌 생산적 자원으로 작동하고 있음을 보여준다. 본 연구는 사전학, 한국어 교육, 자연어처리 기반 어휘 자원 구축, 동아시아 언어 비교 연구 등 다양한 분야에서 기초 자료로 활용될 수 있을 것으로 기대된다.
Hwa-young Kim (Wed,) studied this question.