基于上下文信息融合的细粒度图像识别方法、系统及设备

AITNT
正文
推荐专利
基于上下文信息融合的细粒度图像识别方法、系统及设备
申请号:CN202411113638
申请日期:2024-08-14
公开号:CN119206431B
公开日期:2025-11-11
类型:发明专利
摘要
本发明公开了一种基于上下文信息融合的细粒度图像识别方法、系统及设备,本发明的方法包括:获取训练所用的多模态细粒度的图像数据集并进行预处理;构建细粒度图像识别神经网络,其包括视觉编码器、基于函数的上下文信息融合路径、基于模板的上下文信息融合路径和输出汇聚模块,两个上下文信息融合路径分别实现特征融合以及跨模态交互学习过程,输出汇聚模块用于对交互增强后的多模态表征进行解析,并由分类器生成与每种模态表征对应的预测结果;在预处理后的图像数据集上训练细粒度图像识别神经网络,最后将待分类的测试细粒度图像和匹配的上下文信息输入到训练好的细粒度图像识别神经网络中,得到测试细粒度图像的识别结果。
技术关键词
卷积特征 多模态 视觉特征 计算机电子设备 模板 分类器 跨模态 日期 预训练语言模型 图像识别系统 语义 编码器 非线性 上下文特征 存储计算机程序 数据 解码器
系统为您推荐了相关专利信息
1
楼宇建筑咨询方法、装置、电子设备及存储介质
查询意图 文本 建筑 模型训练方法 序列
2
基于多因素耦合的班组内燃机车油耗实时监测方法
实时监测方法 机车 油耗 策略 实时监测技术
3
针对LLM的训练样本生成方法和LLM的训练方法
训练样本生成方法 数据 风险评估规则 文本 风险识别模型
4
基于动态模板的印刷电路板表面瑕疵智能检测方法及系统
印刷电路板表面 层级 智能检测方法 图像 检测印刷电路板
5
接口风险检测方法、装置及电子设备
接口 风险检测方法 标签 漏洞 服务器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号