基于视觉大模型的重量估计方法

AITNT
正文
推荐专利
基于视觉大模型的重量估计方法
申请号:CN202411511389
申请日期:2024-10-28
公开号:CN119379652A
公开日期:2025-01-28
类型:发明专利
摘要
本发明公开了一种基于视觉大模型的重量估计方法,包括:获取多模态重量数据集,构建视觉语言模型,基于所述多模态重量数据集对所述视觉语言模型进行两个阶段的训练;基于所述多模态重量数据集获得微调数据集;基于微调数据集、类别引导策略和参考校准策略对完成第二阶段训练的视觉语言模型获得重量估计模型;基于重量估计模型与待评估的物体图像进行重量估计。本发明通过类别引导策略和参考校准策略有效提升了视觉大模型的重量估计精度和重量推理能力。
技术关键词
估计方法 多模态 视觉 校准策略 物体 图像 数据格式 处理器 阶段 存储器 机制 网络 指令 动态 精度 参数
系统为您推荐了相关专利信息
1
视频录制方法、设备、存储介质及程序产品
视频帧 视频录制器 视频录制方法 计算机程序产品 人脸识别信息
2
基于RFID与视觉检测的工件追溯分拣系统及方法
定位单元 工业机器人单元 阻挡定位机构 工业机器人路径规划 校正工装
3
一种激光雷达与摄像机融合的装船机测量系统及方法
广角摄像机 激光雷达 特征匹配关系 测距组件 云台
4
图像处理方法、装置、存储介质、电子设备及AR眼镜
语义分割模型 编码特征 融合多模态特征 解码 空间金字塔池化
5
一种应用于显微图像的基于少标签训练的虚拟重聚焦方法
重聚焦方法 图像模糊程度 标签 数据 计算机视觉技术
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号