摘要
本申请公开了一种冷启动驱动及主动学习机制相结合的数字人形象生成方法,本方案通过源于冷启动过程且具备高度个性化与动态适配性的预设少样本情感语音生成模型对输入数据进行处理,可以在大规模未标注输入数据上实现高效的个性化、多情感语音批量生成,从而输出高保真、情感与个性表达一致的目标音频文件;并且预设少样本情感语音生成模型是基于对候选训练样本利用第一冷启动质量评估器筛选后的第一合格样本训练得到的,使得能够在极少数据条件下启动,实现了在小样本条件下的高质量个性化数字人形象自动生成;另外,通过输入目标情感嵌入向量及目标性格特征向量,实现语音驱动下的表情同步生成,增强数字人自然交互能力与风格一致性。
技术关键词
语音生成模型
形象生成方法
图像生成器
指标
条件生成对抗网络
训练样本集
语音可懂度
控制器模块
文本
回放模块
数据
机制
风格
适配器
拉普拉斯
参数
调节器
系统为您推荐了相关专利信息
振动控制方法
RBF神经网络
驱动机械臂
肌腱
轨迹
隧道结构
数值分析模型
层次分析方法
风险评估方法
易损性分析方法
参数量化方法
深度学习模型
性能指标数据
启发式搜索算法
机器学习模型
风险评估值
遥感影像数据
风险评估模型
文本
指标
围岩大变形
PCA算法
主成分分析算法
围岩变形
指标