摘要
本发明公开了一种基于多模态大模型的通用图像标注系统,涉及图像数据标注和人工智能技术领域,包括用户交互模块、数据集模块、自动标注模块和后端模块。本发明还公开了一种基于多模态大模型的通用图像标注方法,包括S100、数据集准备;S200、多模态大模型构建;S300、多模态大模型训练;S400、多模态大模型部署;S500、基于多模态大模型的通用图像标注。本发明基于多模态大模型,标注精度高,大幅提高了标注效率,节省了人工成本,显著降低了标注过程中的人工参与的程度,解决了现有技术在非标准类别识别和描述上的难题,在兼顾图像目标检测精度的前提下,实现了目标类别和属性的泛化能力。
技术关键词
多模态
图像标注系统
图像标注方法
视觉特征
大语言模型
文本
检测器
数据
参数
指令
模块通信
自然语言
深度神经网络
人工智能技术
非标准
坐标
物体
阶段
系统为您推荐了相关专利信息
多模态深度学习
室内定位方法
深度学习模型
注意力
特征提取网络