摘要
本发明公开了用于生成具身机器人可操作区域的多模态大模型训练方法,涉及人工智能技术领域。该方法包括:利用所述多模态数据对多模态大模型进行预训练,得到预训练的多模态大模型;利用调用专家模型的指令数据对预训练的多模态大模型进行微调,得到训练好的多模态大模型,以便利用输入的具身机器人的多模态数据,输出具身机器人的可操作关键物体部位和可操作关键物体部位之间的语义关系,或/和通过调用专家模型输出可视化的可操作关键点和可操作关键点的位置坐标。提升了具身机器人在复杂环境中的操作能力和灵活性;增强了具身机器人对多模态信息的处理能力,改善了环境感知的准确性;提高了对物体分割和定位的精度,减少了操作失误。
技术关键词
模型训练方法
多模态
关键点
物体
图像定位模型
指令
语义
机器人本体
图像分割模型
模型训练装置
关系
人工智能技术
数据获取模块
处理器
坐标
视觉
存储器
传感器
系统为您推荐了相关专利信息
智能巡检
预警方法
数字孪生体
多源信息融合算法
风险评估值
摄像单元
航拍系统
三维激光扫描系统
点云模型
坐标
预测诊断系统
多模态数据融合
龙虾养殖池
水质传感器
时钟同步协议
多模态学习方法
样本
语义关联网络
数据
模态特征