摘要
本申请涉及视频检索技术领域,适用于金融科技及医疗健康养老领域,公开了一种时序定位方法,该时序定位方法包括:获取视频数据和文本描述数据;将文本描述数据输入至文本编码模型,得到词级特征编码和句级特征编码;将视频数据输入至视频编码模型,得到视频特征编码;将词级特征编码、句级特征编码和视频特征编码输入至待训练的时序定位模型的特征交融层,得到片段特征编码;将片段特征编码输入至待训练的时序定位模型的感知预测器,计算得到总损失,总损失包括至少一个正则化项;根据总损失对待训练的时序定位模型进行参数迭代,并在总损失满足预设条件时,得到时序定位模型。该时序定位方法使得用户能够利用文本实现视频片段检索。
技术关键词
视频编码
时序
定位方法
文本
网络
视频检索技术
计算机设备
模型训练模块
可读存储介质
实例分割
医疗健康
数据获取模块
处理器
编码模块
参数
关键点
存储器
系统为您推荐了相关专利信息
混合深度学习模型
空间特征提取
滑动窗口机制
解码器
分支
绘画平台
动态资源调度
时序预测模型
云端
监测服务系统
三角警示牌
静态特征
动态预测模型
节点
实时图像