基于融合大模型的图像识别方法、系统、设备及存储介质

正文

推荐专利

申请号：CN202410770369

申请日期：2024-06-14

公开号：CN118609138A

公开日期：2024-09-06

类型：发明专利

摘要

本申请实施例公开了一种基于融合大模型的图像识别方法、系统、设备及存储介质。本申请实施例提供的技术方案，通过接收待识别图像以及待识别图像的交互式文本数据，将待识别图像和交互式文本数据输入预构建的多模型融合网络中；基于多个专用标签模型和多模态大模型采集待识别图像的目标图像特征，基于语言大模型采集待识别图像的目标文本特征；基于目标图像特征和目标文本特征确定标签识别结果，基于标签识别结果生成对应交互式文本数据的回复信息。采用上述技术手段，通过模型融合的方式实现对少样本的精准识别，简化模型训练流程，提升模型训练效率。

技术关键词

图像识别方法专用标签文本训练特征融合注意力多模型多模态计算机可执行指令计算机程序产品图像识别设备网络图像识别系统处理器可读存储介质数据分块

系统为您推荐了相关专利信息

锂电池顶盖焊接缺陷检测方法、装置及锂电池生产系统

锂电池顶盖焊接缺陷检测方法焊接缺陷检测装置缺陷检测单元 PLC控制单元

基于大语言模型的地址检测和处理方法、装置及介质

大语言模型行政区划信息列表文本处理器

一种基于大模型的医疗行业智能危重症临床诊疗决策辅助对话系统及方法

辅助对话系统信息检索对话方法决策生成指令

一种基于卷积注意力神经网络的撕裂模识别方法

注意力神经网络卷积神经网络模型识别方法数据计算机存储介质

一种大模型驱动的客诉归因系统

编码向量归因隐式特征语义特征 Sigmoid函数

基于融合大模型的图像识别方法、系统、设备及存储介质

站点导航

APP 下载