What question did this study set out to answer?

构建标准化的藏语拉萨方言语音识别数据集，以提升数据可用性。

March 18, 2026

XBMU-bo-Lhasa31：藏语拉萨方言语音识别数据集

Key Points

构建标准化的藏语拉萨方言语音识别数据集，以提升数据可用性。
开发了包含51名说话者录音的语音识别数据集。
采集了24,289个语音样本，总计31.61小时音频。
在真实环境中利用自研录音软件采集数据。
实施了包括人工核查和语音活动检测在内的质量控制流程。
构建了具有标准化语言内容的大规模藏语语音识别数据集。
过滤和规范化录音，提高了数据质量和准确性。

Abstract

藏语语音识别在藏语教育、新闻传播等领域具有重要的应用价值。拉萨方言在拉萨市及其周边地区广泛使用。然而，由于地理等限制，现有藏语语音数据资源仍然有限，高质量的注释数据尤为稀缺。基于此，本研究构建了一个专业设计且标准化的藏语拉萨方言语音识别数据集。数据集采用自研录音软件在真实环境中录制，采集了51名说话者的语音，总时长31.61小时，包含24,289个语音样本，平均每个样本时长4.68秒。数据内容主要选自新闻相关文本，以保证语言规范性和领域代表性。为保障数据质量，实施了严格的质量控制流程：首先对原始文本进行分句并人工核验；录音完成后，采用语音活动检测（VAD）技术过滤并重新获取高质量语音样本；此外，对文本中的非发音符号进行了规范化，提升语音识别的准确性。该数据集的建立为藏语语音识别提供了重要基础资源，预计将促进藏语语音识别技术的发展。

Bookmark

View Full Paper

Bookmark

View Full Paper

XBMU-bo-Lhasa31：藏语拉萨方言语音识别数据集

Key Points

Abstract

Cite This Study