摘要
本申请涉及语言合成技术领域,尤其涉及一种基于喉震信号分析的语音生成方法及系统,其方法包括:通过喉振发声器采集喉震信号;将振动、压力以及声音多维度数据与标准数据库中的喉震数据进行比对,并根据比对结果,对振动、压力以及声音多维度数据进行校准,得到校准后的喉震信号;从喉震信号提取音频信号,通过ICEEMDAN算法,提取音频信号特征,并根据音频信号特征,通过分类模型识别用户当前发声的情感状态;将校准后的喉震信号转换为数字信号,并将数字信号转换为文本信息;根据转换后的文本信息,通过文本转语音技术,结合情感状态及选择的音色,合成并输出语音。本申请能够解决语音克隆精度不足、情感表达单一问题。
技术关键词
语音生成方法
信号分析
分类模型识别
信号特征
语音技术
文本
校准
音频
情感状态识别
数据
发声器
统计语言模型
语音特征
压力
信号转换模块
自动编码器
信号采集模块
系统为您推荐了相关专利信息
激光雷达回波数据
信号特征
降噪方法
滤波算法
脉冲
数据驱动方法
转子系统
燃气轮机
自动编码器
图像
待测芯片
测试探针
信号分析仪
芯片模组
信号发生器