摘要
本发明公开了一种基于动态时间规整的增强语音反馈方法、装置、设备及计算机可读存储介质,该方法包括:获取用户动作对应的用户骨骼点序列,并应用运动学动态时间规整算法将用户骨骼点序列与标准动作模板进行比对,以生成表征动作完成度的动作评估分数;基于动作评估分数,确定用户情绪等级;将用户情绪等级和动作评估分数,输入至预训练的语言生成式模型,生成与用户情绪等级相匹配的情感化反馈文本;基于用户情绪等级,确定语音合成参数;训练并生成个性化音色克隆模型;生成具有用户音色且情感表达与用户情绪等级相匹配的增强语音反馈。本发明具有提供情绪化语音增强反馈的优点。
技术关键词
语音反馈方法
动态时间规整算法
音色特征
文本
关节点
可读存储介质
序列
加速度
参数
矩阵
反馈装置
模板
处理器
样本
模块
程序
计算机
系统为您推荐了相关专利信息
语音质检方法
情绪识别模型
质检模型
多模态特征融合
计算机可读指令
文本
解码器
局部注意力机制
多模态
计算机程序指令
情感分析方法
文本编码器
表达式
情感分析系统
情感分析技术