摘要
本申请实施例公开了一种基于融合大模型的图像识别方法、系统、设备及存储介质。本申请实施例提供的技术方案,通过接收待识别图像以及待识别图像的交互式文本数据,将待识别图像和交互式文本数据输入预构建的多模型融合网络中;基于多个专用标签模型和多模态大模型采集待识别图像的目标图像特征,基于语言大模型采集待识别图像的目标文本特征;基于目标图像特征和目标文本特征确定标签识别结果,基于标签识别结果生成对应交互式文本数据的回复信息。采用上述技术手段,通过模型融合的方式实现对少样本的精准识别,简化模型训练流程,提升模型训练效率。
技术关键词
图像识别方法
专用标签
文本
训练特征融合
注意力
多模型
多模态
计算机可执行指令
计算机程序产品
图像识别设备
网络
图像识别系统
处理器
可读存储介质
数据
分块
系统为您推荐了相关专利信息
锂电池顶盖
焊接缺陷检测方法
焊接缺陷检测装置
缺陷检测单元
PLC控制单元
注意力神经网络
卷积神经网络模型
识别方法
数据
计算机存储介质
编码向量
归因
隐式特征
语义特征
Sigmoid函数