摘要
本申请涉及一种口播视频智能运镜方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。所述方法包括:获取原始口播视频;对原始口播视频进行多模态数据提取,得到多模态数据,并对多模态数据进行多模态数据整合,得到运镜基础数据;根据运镜基础数据生成目标运镜动画序列;根据目标运镜动画序列生成目标关键帧序列;根据关键帧序列对原始口播视频进行运镜应用,得到目标口播视频。采用本方法通过整合语义分析和肢体检测技术实现多模态数据整合,能够更加自动化地为口播视频生成专业的运镜效果。
技术关键词
多模态
关键帧
数据
视频
序列
语义
动画
计算机程序产品
基础
可读存储介质
模板
画面
模式
计算机设备
模块
文本
音频
处理器
参数
系统为您推荐了相关专利信息
预警系统
高斯混合模型
小波变换算法
特征提取单元
人工神经网络
账号
神经网络模型训练
编码
循环神经网络模型
计算机程序产品
仓储系统
播种方法
控制系统
人工智能识别
识别区