用于生成具身机器人可操作区域的多模态大模型训练方法

正文

推荐专利

申请号：CN202510344276

申请日期：2025-03-21

公开号：CN120181127A

公开日期：2025-06-20

类型：发明专利

摘要

本发明公开了用于生成具身机器人可操作区域的多模态大模型训练方法，涉及人工智能技术领域。该方法包括：利用所述多模态数据对多模态大模型进行预训练，得到预训练的多模态大模型；利用调用专家模型的指令数据对预训练的多模态大模型进行微调，得到训练好的多模态大模型，以便利用输入的具身机器人的多模态数据，输出具身机器人的可操作关键物体部位和可操作关键物体部位之间的语义关系，或/和通过调用专家模型输出可视化的可操作关键点和可操作关键点的位置坐标。提升了具身机器人在复杂环境中的操作能力和灵活性；增强了具身机器人对多模态信息的处理能力，改善了环境感知的准确性；提高了对物体分割和定位的精度，减少了操作失误。

技术关键词

模型训练方法多模态关键点物体图像定位模型指令语义机器人本体图像分割模型模型训练装置关系人工智能技术数据获取模块处理器坐标视觉存储器传感器

系统为您推荐了相关专利信息

一种消防设施多维状态感知的智能巡检与预警方法、系统及存储介质

智能巡检预警方法数字孪生体多源信息融合算法风险评估值

一种高压线镜架分体式安全链接结构测试方法及系统

链接结构结构疲劳损伤镜架测试方法数据

一种航拍系统及其镜头辅助组件

摄像单元航拍系统三维激光扫描系统点云模型坐标

基于多模态数据融合技术的龙虾养殖数据预测诊断系统

预测诊断系统多模态数据融合龙虾养殖池水质传感器时钟同步协议

一种基于语义匹配的上下文模态补全多模态学习方法

多模态学习方法样本语义关联网络数据模态特征

用于生成具身机器人可操作区域的多模态大模型训练方法

站点导航

APP 下载