摘要
本公开涉及一种口型动画序列生成方法及装置。该方法包括:对包括输入音频和/或输入文本的输入信息进行处理得到对应输入信息的音素序列;基于音素序列和匹配出的目标映射表,确定出音素序列中各音素对应的视素形成视素序列;根据视素序列和对应的目标信息对各视素在视素序列中的权重进行调整形成调整后视素序列;基于目标映射表确定调整后视素序列中各视素对应的口型动画;根据口型动画生成口型动画序列。利用与输入信息匹配的目标映射表实现基于输入信息生成的音素序列到视素序列、再到口型动画序列的生成,输入要求低,口型动画序列适合不同口音、语种且生成速度快、时间短,与音频的同步匹配程度好、精准性高,无需人工调试人工成本低。
技术关键词
动画
语音特征
序列生成方法
音频
序列生成装置
非易失性计算机可读存储介质
关系
对象
计算机程序指令
文本
平滑算法
处理器
子模块
年龄
存储器
发音
速度
系统为您推荐了相关专利信息
语音特征
编码器
文本
强化学习框架
多头注意力机制
价值评估方法
媒体
学习算法
神经网络模型训练
音频特征
语音验证码
电视
生成方法
多模态身份认证
个性化语音
监控分析系统
音频
音视频
优化卡尔曼滤波
协方差矩阵