摘要
本发明涉及图像检测技术领域,可应用于金融科技、医疗健康等业务系统平台中,揭露了基于扩散模型的视频素材检索方法、装置、设备及介质,所述方法包括:获取检索文本以及多个视频素材,对所述检索文本以及所述视频素材进行特征编码,获取对应的文本特征和视频特征;对所述文本特征和所述视频特征进行扩散相似度计算,生成所述文本特征和所述视频特征之间的扩散相似度矩阵;根据所述扩散相似度矩阵,对所述视频素材与所述检索文本进行匹配,获取初始视频素材序列;对所述初始视频素材序列进行函数检索优化,得到所述检索文本对应的目标视频素材序列。本发明可以提高视频素材检索效率以及检索准确率。
技术关键词
文本
检索方法
序列
矩阵
语义关联度
图像检测技术
关键词
视频帧
检索装置
医疗健康
视频编码
电子设备
处理器通信
业务系统
编码模块
匹配模块
机制
系统为您推荐了相关专利信息
查询意图
非结构化数据库
信息检索方法
强化学习模型
文本
局部注意力机制
三维点云配准
模型设计方法
多层次特征
特征提取网络