摘要
本申请涉及人工智能技术领域,公开了一种基于人工智能的业绩说明会视频生成方法及装置,该方法包括:通过人工智能引擎解析演示文档,提取文本内容和视觉设计元素;基于企业知识库对文本内容执行合规化处理,生成标准化讲稿并转换为带时间标记的音频流;根据视觉设计元素自动匹配品牌视觉资产,在视频画布上生成包含数字人形象的动态场景模板;基于音频流的时间标记,同步计算数字人驱动参数和视觉元素时序表;将动态场景模板、数字人驱动参数和视觉元素时序表输入多层渲染引擎,驱动数字人进行渲染并控制视觉元素出场时序,合成并输出业绩说明会视频。本申请能够自动生成业绩说明会视频,提高视频制作的效率和质量,降低视频制作成本。
技术关键词
视频生成方法
动态场景
企业知识库
人工智能引擎
文本
元素
时序
计算机视觉算法
音频
画布
标记
模板
光学字符识别技术
资产
参数
标识
显示区域尺寸
视频生成装置
系统为您推荐了相关专利信息
知识图谱构建方法
语义
流形学习算法
元学习策略
实体
命名实体识别模型
智能分析方法
双向长短期记忆网络
文本
规范数据格式
识别文档图像
多模态
无格式文本
文档识别方法
区域位置信息