摘要
本发明公开了一种基于混合感知的多模态人机交互系统,涉及人机交互技术领域;本发明通过多模态数据融合与动态优先级机制,显著提升了交互终端的环境适应性与响应效率;数据采集模块利用摄像头与麦克风同步获取视频流和音频流,结合红外传感器计算用户距离,可在复杂场景中精准识别基础对象,避免误标记;交互分析模块基于距离特征与语音能量构建优先级评分体系,既保证了近场用户的交互优先权,又能通过语音能量捕捉主动交互意图,解决了多用户场景下的交互冲突问题;当目标对象在设定时间二内无语音信号时,系统自动切换至其他发声基础对象,避免交互中断,提升用户体验。
技术关键词
人机交互系统
唇形特征
对象
交互终端
交互内容
语音特征
基础
麦克风
Sigmoid函数
数据采集模块
多模态数据融合
红外传感器
识别视频流
信号
人机交互技术
分析模块
音频
融合特征
系统为您推荐了相关专利信息
定位方法
故障树结构
对象
机器可读程序
分析故障
飞行器测试方法
虚拟对象
深度学习网络
训练样本数据
轨迹规划算法