摘要
本申请提供一种基于AIGC数字人的慕课视频生成方法及装置,涉及人工智能生成内容技术领域。该方法包括:将目标动作序列输入目标数字人模型,驱动目标数字人模型按照目标动作序列执行对应的目标动作,得到目标数字人教学视频;采用虚拟引擎构建目标虚拟教学场景,将目标数字人模型嵌入目标虚拟教学场景,得到目标教学数字人模型;采用多模态AI模型,根据目标课件,确定视频背景图、目标数字人模型的装饰、语音参数;基于预设模板、视频参数,根据目标数字人教学视频,目标教学数字人模型、视频背景图、目标数字人模型的装饰、语音参数,生成慕课视频。本申请能够提升沉浸感与实操效果,实现“因材施教”,降低人力与时间成本,适用于大规模课程生产。
技术关键词
教学场景
背景图
强化学习算法
视频生成方法
动作特征
模型库
注意力机制
参数
序列
时序
语音特征
多模态
视频生成装置
画像
装饰
NLP技术
基础
系统为您推荐了相关专利信息
指令生成方法
视频时空特征
跨模态
关键帧
动作特征
宠物情绪识别
卷积神经网络提取
动作特征
预训练模型
表情特征
手持控制设备
工作设备
采集电极
参数
运动传感器
生成视频封面
视频封面生成方法
视频帧集合
背景图
实体