摘要
本发明公开了基于多模态大模型和强化学习的人机交互装配方法及系统,包括以下步骤:数据采集模块采集装配环境信息及文本指令,所述文本指令包括由语音指令转换生成的文本指令及由用户直接输入的文本指令;多模态处理模块将装配环境信息及文本指令进行多模态融合,生成多模态信息,将所述多模态信息及已完成任务输入至视觉语言大模型中;视觉语言大模型根据多模态信息和已完成的任务,输出新的任务,再将新任务划分成若干子任务;计算机控制系统利用控制指令库,根据子任务顺序提取对应指令,依序执行对应指令。本发明更全面地理解和处理装配工作环境中的复杂信息,使得大模型能满足日益复杂的装配任务需求。
技术关键词
计算机控制系统
多模态信息
机械臂
特征级融合方法
数据采集模块
图像视觉特征
文本特征向量
图像特征向量
强化学习模型
控制工业机器人
子模块
语义分割方法
高维特征向量
指令方法
系统为您推荐了相关专利信息
分类搬运装置
异形工件
控制柜组件
红外传感器
快速切换方法
磨损补偿功能
磨损检测机构
焊接装置
补偿调节机构
电极夹持器