摘要
本公开的实施例提供了确定视频片段的方法、装置、设备、存储介质和程序产品。该方法包括获取目标视频和与目标用户相关联的描述信息,目标视频包括视频帧信息、音频信息和字幕信息,描述信息指示与对目标视频的片段提取相关的要求;从视频帧信息提取视觉特征表示、从音频信息提取音频特征表示、从字幕信息提取第一文本特征表示以及从描述信息提取第二文本特征表示;基于视觉特征表示、音频特征表示、第一文本特征表示和第二文本特征表示,从目标视频确定与描述信息相匹配的至少一个候选视频片段;以及至少基于至少一个候选视频片段各自对应的字幕信息,从至少一个候选视频片段确定与目标用户相关的至少一个目标视频片段。
技术关键词
字幕信息提取
音频特征
视觉特征
计算机可执行指令
标识
视频帧信息
音频编码器
文本编码器
处理器
多模态
特征提取模块
变换器
计算机程序产品
可读存储介质
存储器
系统为您推荐了相关专利信息
设备标识符
智能设备
智能网关设备
旋转计数器
智能入库设备
电池温度预测方法
温度预测模型
待测电池
电流值
温升
风速预测模型
预测序列数据
气象
爬坡事件
模型训练方法
命名实体识别方法
文本
依存句法
预训练模型
上下文特征