摘要
本发明涉及数据处理技术领域,特别涉及一种自然语言处理系统与方法,包括特殊语段构建模块,用于构建包含所有中文发音的特殊语句,并利用发音覆盖算法和发音拆分技术将其拆分成发音段;音色预存与管理模块,设有录音设备接口、音色特征提取单元和数据库存储与管理单元,用于建立个人音色库;本方案中,通过构建特殊语段并拆分,结合MFCC、LPC算法进行音色预存,建立了个性化音色库;在特殊情况下,利用相同算法提取实时语音音色特征,结合DTW算法匹配,依据阈值判断;实现了在用户酒后、生病等声音变化场景下,准确识别语音指令发出者身份,提高语音指令识别的准确性和可靠性。
技术关键词
实时语音
音色特征
发音
覆盖算法
拆分技术
自然语言理解
特征提取单元
梅尔频率倒谱系数
动态时间规整算法
录音设备
端点检测技术
系统监控
识别语音指令
语音指令识别
语义角色标注
隐马尔可夫模型
线性预测编码
语音活动检测
系统为您推荐了相关专利信息
语音转换方法
重构模块
说话人身份信息
嵌入特征
样本
语音特征
时间段
实时语音
开关控制方法
语音识别精度