摘要
本发明公开了一种融合视觉识别与语音交互的四足机器人货物摆放纠正方法,包括如下步骤:S1、采集并预处理货物图像,生成标准化图像输入集合;S2、构建空间状态感知模型,提取图像特征并生成误差向量;S3、识别用户语音并提取方向与动作指令等语义关键词;S4、融合误差向量与语义关键词,生成多模态融合输入表示并编码为融合嵌入表示;S5、基于融合嵌入表示生成步态控制参数和动作控制序列,构建动作计划结构;S6、执行动作计划结构完成货物位置与姿态纠偏,记录状态反馈数据;S7、结合状态反馈与追加语音,构建交互式纠偏闭环控制流程,更新控制信息。本发明增强了机器人多模态理解与动作调整能力。
技术关键词
动作计划
融合视觉
纠正方法
语义关键词
误差向量
四足机器人
语音
原始图像数据
纠偏控制系统
多模态
机器人动力学参数
序列
机器人动力学模型
采集运动状态
机器人本体
姿态误差
底层控制系统
系统为您推荐了相关专利信息
纠正方法
特征值
多尺度卷积神经网络
构建机器学习模型
流形学习算法
轨迹纠正方法
搅拌摩擦焊接系统
二值化图像
焊缝
焊头
接收机
收发机
二阶噪声
多基地雷达系统
加权最小二乘法
船舶动力定位系统
推力分配方法
方位角
动力定位系统控制技术
误差向量