用于生成具身机器人可操作区域的多模态大模型训练方法

AITNT
正文
推荐专利
用于生成具身机器人可操作区域的多模态大模型训练方法
申请号:CN202510344276
申请日期:2025-03-21
公开号:CN120181127A
公开日期:2025-06-20
类型:发明专利
摘要
本发明公开了用于生成具身机器人可操作区域的多模态大模型训练方法,涉及人工智能技术领域。该方法包括:利用所述多模态数据对多模态大模型进行预训练,得到预训练的多模态大模型;利用调用专家模型的指令数据对预训练的多模态大模型进行微调,得到训练好的多模态大模型,以便利用输入的具身机器人的多模态数据,输出具身机器人的可操作关键物体部位和可操作关键物体部位之间的语义关系,或/和通过调用专家模型输出可视化的可操作关键点和可操作关键点的位置坐标。提升了具身机器人在复杂环境中的操作能力和灵活性;增强了具身机器人对多模态信息的处理能力,改善了环境感知的准确性;提高了对物体分割和定位的精度,减少了操作失误。
技术关键词
模型训练方法 多模态 关键点 物体 图像定位模型 指令 语义 机器人本体 图像分割模型 模型训练装置 关系 人工智能技术 数据获取模块 处理器 坐标 视觉 存储器 传感器
系统为您推荐了相关专利信息
1
一种消防设施多维状态感知的智能巡检与预警方法、系统及存储介质
智能巡检 预警方法 数字孪生体 多源信息融合算法 风险评估值
2
一种高压线镜架分体式安全链接结构测试方法及系统
链接结构 结构疲劳损伤 镜架 测试方法 数据
3
一种航拍系统及其镜头辅助组件
摄像单元 航拍系统 三维激光扫描系统 点云模型 坐标
4
基于多模态数据融合技术的龙虾养殖数据预测诊断系统
预测诊断系统 多模态数据融合 龙虾养殖池 水质传感器 时钟同步协议
5
一种基于语义匹配的上下文模态补全多模态学习方法
多模态学习方法 样本 语义关联网络 数据 模态特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号