基于融合大模型的图像识别方法、系统、设备及存储介质

AITNT
正文
推荐专利
基于融合大模型的图像识别方法、系统、设备及存储介质
申请号:CN202410770369
申请日期:2024-06-14
公开号:CN118609138A
公开日期:2024-09-06
类型:发明专利
摘要
本申请实施例公开了一种基于融合大模型的图像识别方法、系统、设备及存储介质。本申请实施例提供的技术方案,通过接收待识别图像以及待识别图像的交互式文本数据,将待识别图像和交互式文本数据输入预构建的多模型融合网络中;基于多个专用标签模型和多模态大模型采集待识别图像的目标图像特征,基于语言大模型采集待识别图像的目标文本特征;基于目标图像特征和目标文本特征确定标签识别结果,基于标签识别结果生成对应交互式文本数据的回复信息。采用上述技术手段,通过模型融合的方式实现对少样本的精准识别,简化模型训练流程,提升模型训练效率。
技术关键词
图像识别方法 专用标签 文本 训练特征融合 注意力 多模型 多模态 计算机可执行指令 计算机程序产品 图像识别设备 网络 图像识别系统 处理器 可读存储介质 数据 分块
系统为您推荐了相关专利信息
1
锂电池顶盖焊接缺陷检测方法、装置及锂电池生产系统
锂电池顶盖 焊接缺陷检测方法 焊接缺陷检测装置 缺陷检测单元 PLC控制单元
2
基于大语言模型的地址检测和处理方法、装置及介质
大语言模型 行政区划信息 列表 文本 处理器
3
一种基于大模型的医疗行业智能危重症临床诊疗决策辅助对话系统及方法
辅助对话系统 信息检索 对话方法 决策 生成指令
4
一种基于卷积注意力神经网络的撕裂模识别方法
注意力神经网络 卷积神经网络模型 识别方法 数据 计算机存储介质
5
一种大模型驱动的客诉归因系统
编码向量 归因 隐式特征 语义特征 Sigmoid函数
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号