本研究提出了一种空气书写识别技术,使得在公共显示屏、车载系统和增强现实眼镜等环境中实现无缝的无接触文本输入。通过利用直观的手写方式,该方法扩展了人机交互的设计空间,适用于物理键盘或触摸屏不实用的场景。它通过消除对语音或触摸输入的需求,提供潜在的隐私优势,并通过支持任意词汇而不依赖于预定义词典或先前训练,促进了包容性。所提出的系统Mobile-AeroText采用基于GELAN的单阶段目标检测网络。它将指尖轨迹转换为二值图像,并同时检测和识别字符区域,实现无需明确边界手势的稳健的词级识别。在对25名参与者和1600个单词的评估中,Mobile-AeroText的词识别率为91.44%,字符识别率为95.86%,平均延迟为417毫秒。主观评估的系统可用性评分为78.5,NASA-TLX评分为33.6,表明其高可用性和低认知负担。总体而言,本研究提出了一种实用的“随处可写”输入方法,解决了人机交互中的基本挑战:在传统方法不可用或受限的场景中,提供富有表现力、可访问且低负担的文本输入。
中村等(周四)研究了这个问题。