摘要
本发明提供一种多模态智能交互优化方法及系统,首先,根据用户的语音指令获得文本指令数据,并计算语音置信度;对摄像头拍摄图像中的物体进行识别和定位,获得视觉数据,并计算视觉置信度;根据触觉传感器获取智能设备与所接触物体的触觉数据,并计算触觉置信度。然后,根据上述三种感知的置信度调整预设决策模型中每种感知的权重。最后,将文本指令数据、视觉数据和触觉数据输入调整权重后的决策模型,得到任务执行策略。本发明公开的方法及系统,能够将语音、视觉和触觉感知相结合,同时,引入置信度评估机制,对任务执行进行多重验证,确保根据不同感知数据的准确性和可靠性做出动态调整。
技术关键词
智能设备
摄像头拍摄图像
触觉传感器
交互优化方法
数据
物体
策略
文本
加速度
自然语言理解模型
决策
多模态
计算机视觉算法
指令
语音识别算法
压力
词语
语义
系统为您推荐了相关专利信息
综合测试方法
板卡
综合测试系统
加密算法
哈希算法
无人飞行器避障
障碍物检测识别
飞行路径控制
深度学习训练
超声波传感器数据
数据智能分类
盾构掘进参数
盾构掘进系统
长短期记忆网络
盾构机