摘要
本发明提供一种AI驱动的个性化语音训练与发音矫正系统;该系统首先采集用户在语音训练过程中的原始语音数据,并提取包括音高、语速、语调、共振峰参数及对应文本在内的多维语音特征向量;基于所述特征向量,识别当前语音所处的语境标签,并构建用户的发音特征向量;系统进一步依据语境标签调用标准发音数据库,生成相应语境下的目标发音特征向量,并将用户发音与目标发音进行多维比对,获取包含发音部位、语速和情感差异的差异参数集;最终,系统生成包含发音动作指引、语调调整提示和语义情绪强化指令的矫正建议,并接收用户反馈信息,提升个性化训练效果;本发明可实现语境感知下的精准发音矫正,增强语音训练的个性化与智能化水平。
技术关键词
发音矫正系统
个性化语音
纠错
标签
参数
三维发音器官
偏移特征
分析单元
模块
多模态
统一时间轴
语义
动画
动态
轨迹
变化轮廓
轮廓差异
系统为您推荐了相关专利信息
XGBoost模型
效能评估方法
互联网
扩充训练样本
仿真平台
三维人体模型
视角
基元解码器
深度神经网络
图像编码器