摘要
本申请属于人工智能技术领域,涉及一种基于人工智能的数据检索方法、装置、计算机设备及存储介质,包括:获取与目标视频对应的检索文本;对检索文本进行文本预处理得到文本嵌入表示;对目标视频进行图像特征提取得到图像特征;调用层叠指针网络中的交叉注意力层对文本嵌入表示与图像特征进行交叉注意力处理得到多个帧的特征表示;对多个帧的特征表示进行预测处理得到片段起始位置,并基于片段起始位置确定片段起始区间;基于文本嵌入表示对片段起始区间进行偏置预测处理得到预测结果;基于预测结果生成与检索文本对应的目标片段位置。此外,目标片段位置可存储于区块链中。本申请基于层叠指针网络的使用提高了视频数据检索的处理效率与准确性。
技术关键词
数据检索方法
文本
图像特征提取
计算机可读指令
数据推送方式
注意力
指针
图像编码器
层叠
视频
计算机设备
数据检索装置
网络
可读存储介质
置信度阈值
分词
人工智能技术
模块
处理器
系统为您推荐了相关专利信息
配置生成方法
关键字
意图识别
生成系统
动态更新
语义向量
自动检测方法
多层感知机
策略
自然语言文本