摘要
本发明涉及图像检测技术领域,可应用于金融科技、医疗健康等业务系统平台中,公开了一种基于多尺度视觉的图像数据检索方法、装置、设备及介质,包括:获取视觉示例图像集合,提取视觉示例图像集合的文本提示数据;提取视觉示例图像集合中视觉图像的视觉标记序列;对视觉标记序列进行非参数化语义融合,得到视觉融合标记序列;对文本提示数据中的分词进行语义标记,得到文本语义标记序列,将视觉融合标记序列与文本语义标记序列进行拼接,得到复合查询标记序列;提取图像集合中待检索图像的图像特征标记序列,计算复合查询标记序列与图像特征标记序列的匹配分数;根据匹配分数从图像集合中检索出图像数据。本发明可以提升图像数据检索的准确性。
技术关键词
图像数据检索方法
标记
序列
检索图像
视觉特征
多尺度
语义
文本
图像检测技术
冗余
定位框
可读存储介质
分词
医疗健康
处理器
拼接模块
系统为您推荐了相关专利信息
HTML5技术
资源管控方法
堡垒机
负载均衡器
决策分析系统
变电站评价方法
融合注意力机制
数据预测模型
神经网络模型
计算机程序代码
辨识方法
数学模型
机器人动力学模型
机器人关节
动力学参数辨识
稳定性评估方法
电网历史数据
客户端
参数
预训练模型