摘要
本申请提出的视频时刻检索方法和装置、电子设备、存储介质,涉及人工智能技术领域,适用于金融科技领域及医疗健康领域。该方法包括:对目标视频进行时空编码,得到初始时空特征图;通过第一分层自适应粒度变换器对初始时空特征图进行特征变换,得到第一层级时空特征图;通过第二分层自适应粒度变换器对第一层级时空特征图进行特征变换,得到第二层级时空特征图;将第一层级时空特征图和第二层级时空特征图进行特征融合,得到多尺度时空特征;获取检索需求信息,然后进行文本编码得到检索需求信息特征;对检索需求信息特征和多尺度时空特征进行特征解码,再然后进行时刻预测,得到目标片段起止时刻。本申请能够提高视频时刻检索效率。
技术关键词
注意力
变换器
多层感知器
感知特征
池化特征
层级
检索方法
分层
视频
多尺度
解码
编码向量
电子设备
分区
人工智能技术
检索装置
医疗健康
模块
信息编码
系统为您推荐了相关专利信息
车辆路径规划方法
车辆路径规划系统
深度强化学习
测试数据生成器
初始化解码器
门控循环神经网络
注意力机制
矿热炉电极长度
神经网络单元
归一化模块