数字人视频生成方法、装置、设备及介质

AITNT
正文
推荐专利
数字人视频生成方法、装置、设备及介质
申请号:CN202411535133
申请日期:2024-10-30
公开号:CN119484950A
公开日期:2025-02-18
类型:发明专利
摘要
本发明涉及人工智能技术领域,公开了一种数字人视频生成方法、装置、设备及介质,包括:获取目标音频数据、目标数字人图像和目标情感提示信息,对目标音频数据进行特征转换,确定目标音频数据对应的视素特征,根据目标情感提示信息,匹配对应的情感特征提取技术,通过情感特征提取技术对目标情感提示信息进行特征提取,得到目标情感提示信息对应的情感特征,将视素特征和情感特征输入至已经进行面部动作预测训练好的模型中,输出面部动作系数,根据目标音频数据、目标数字人图像和面部动作系数,生成目标数字人视频。提高了生成的数字人在情感表达上的真实性和准确性。
技术关键词
特征提取技术 视频生成方法 情感特征 音频 面部 数据 视频生成技术 图像 视频生成装置 可读存储介质 文本 图片 特征提取模块 人工智能技术 处理器 计算机设备 存储器
系统为您推荐了相关专利信息
1
翻唱歌曲识别方法、装置、电子设备与计算机程序产品
识别方法 计算机程序产品 计算机可读指令 索引 音频特征提取
2
一种基于人声分离与修复的K歌音频处理方法
K歌 矩阵 瞬态噪声 短时傅里叶变换 音频信号处理
3
文本转语音方法、装置、计算机设备、可读存储介质和程序产品
语义 置信度阈值 文本转语音方法 音频 解码器
4
基于多智能体的心理测评方法、装置及系统
游戏图像 心理测评方法 文本 框架 大语言模型
5
基于蓝牙组网的数据通讯方法、系统、装置及存储介质
通信节点 功能模块 数据通讯方法 蓝牙组网 通讯设备
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号