一种融合视觉识别与语音交互的四足机器人货物摆放纠正方法

正文

推荐专利

申请号：CN202511092254

申请日期：2025-08-05

公开号：CN120913556A

公开日期：2025-11-07

类型：发明专利

摘要

本发明公开了一种融合视觉识别与语音交互的四足机器人货物摆放纠正方法，包括如下步骤：S1、采集并预处理货物图像，生成标准化图像输入集合；S2、构建空间状态感知模型，提取图像特征并生成误差向量；S3、识别用户语音并提取方向与动作指令等语义关键词；S4、融合误差向量与语义关键词，生成多模态融合输入表示并编码为融合嵌入表示；S5、基于融合嵌入表示生成步态控制参数和动作控制序列，构建动作计划结构；S6、执行动作计划结构完成货物位置与姿态纠偏，记录状态反馈数据；S7、结合状态反馈与追加语音，构建交互式纠偏闭环控制流程，更新控制信息。本发明增强了机器人多模态理解与动作调整能力。

技术关键词

动作计划融合视觉纠正方法语义关键词误差向量四足机器人语音原始图像数据纠偏控制系统多模态机器人动力学参数序列机器人动力学模型采集运动状态机器人本体姿态误差底层控制系统

系统为您推荐了相关专利信息

新能源并网过程中电力系统故障诊断方法及系统

锚点光纤电压传感器注意力机制语义向量序列

一种基于训练图像反馈识别的宠物狗行为纠正方法

纠正方法特征值多尺度卷积神经网络构建机器学习模型流形学习算法

焊接轨迹纠正方法及其设备

轨迹纠正方法搅拌摩擦焊接系统二值化图像焊缝焊头

一种基于双基地距离与距离差测量值联合定位的方法

接收机收发机二阶噪声多基地雷达系统加权最小二乘法

基于改进遗传算法的船舶动力定位系统的推力分配方法

船舶动力定位系统推力分配方法方位角动力定位系统控制技术误差向量

一种融合视觉识别与语音交互的四足机器人货物摆放纠正方法

站点导航

APP 下载