摘要
本申请属于人工智能技术领域,涉及一种视频合成方法、装置、设备及其存储介质,通过获取待分割文本段;进行分割,获得所有子文本段;将所有子文本段作为召回字段,召回不同子文本段所对应的视频合成素材;对待分割文本段进行语音化处理;根据所有子文本段在待分割文本段中的先后关系,对视频合成素材进行排列,设置素材初始切换策略,得到初始视频;将目标输出语音添加到初始视频中,完成目标视频合成。将该视频合成方法,应用到视频混剪合成中,能够结合预训练完成的检索模型,高效从视频合成素材中检索出相关素材合成目标视频,将其应用到金融或者医疗营销业务场景中,能够高效生成新营销视频,便于营销方进行业务推广。
技术关键词
文本
图像特征提取
计算机可读指令
数据
语音
图片
关键字
视频关键帧提取
视频场景分割
字段
关系
策略
特征提取网络
可读存储介质
人工智能技术
节点
系统为您推荐了相关专利信息
深度神经网络
相位调制参数
轨道角动量模式
传播算法
非线性光学技术
无人机遥感数据
激光雷达点云数据
多光谱
热成像
机器学习模型训练
覆冰厚度预测方法
神经网络单元
注意力机制
时序
长短期记忆网络