摘要
本发明公开了一种基于视觉大模型的重量估计方法,包括:获取多模态重量数据集,构建视觉语言模型,基于所述多模态重量数据集对所述视觉语言模型进行两个阶段的训练;基于所述多模态重量数据集获得微调数据集;基于微调数据集、类别引导策略和参考校准策略对完成第二阶段训练的视觉语言模型获得重量估计模型;基于重量估计模型与待评估的物体图像进行重量估计。本发明通过类别引导策略和参考校准策略有效提升了视觉大模型的重量估计精度和重量推理能力。
技术关键词
估计方法
多模态
视觉
校准策略
物体
图像
数据格式
处理器
阶段
存储器
机制
网络
指令
动态
精度
参数
系统为您推荐了相关专利信息
视频帧
视频录制器
视频录制方法
计算机程序产品
人脸识别信息
定位单元
工业机器人单元
阻挡定位机构
工业机器人路径规划
校正工装
广角摄像机
激光雷达
特征匹配关系
测距组件
云台
语义分割模型
编码特征
融合多模态特征
解码
空间金字塔池化
重聚焦方法
图像模糊程度
标签
数据
计算机视觉技术