摘要
本发明公开了一种用于人机交互的语音合成方法及系统,具体涉及语音合成技术领域,用于解决现有语音合成系统在高可靠性场景下对高风险内容缺乏自适应调整能力的问题;是通过多级分析处理机制实现:首先计算声学特征预测值的差分序列并分析异常峰值来确定语音单元的不确定性指标,结合局部信息熵序列变化率检测熵值突变点;然后将不确定性指标与熵值突变点融合识别高不确定性文本片段,通过语义焦点单元识别和语境依存度分析评估语义风险等级;最后根据风险等级自适应调整韵律参数并生成合成语音,从而在保持语音自然度的同时显著提升高风险内容的传达准确性和可靠性。
技术关键词
文本
声学特征
信息熵
语音
语义向量
神经网络声学模型
序列
语句
指标
焦点
概率分布统计
参数
滑动窗口
语义角色
分析模块
高风险
声码器
识别模块
系统为您推荐了相关专利信息
RPA机器人
发票模板
客户关系管理系统
服务器集群
光学字符识别技术