摘要
本发明公开了一种融合环境信息的语音生成方法及装置、存储介质、设备,涉及声音信号处理技术领域及金融及医疗技术领域,主要在于解决现有技术中基于语音的文字内容生成的语音缺乏除语义信息之外的环境信息的问题,包括获取待处理语义文本和待融入目标环境描述文本,并基于所述待融入目标环境描述文本从语音库中确定多条目标语音信息;所述目标语音信息携带与所述待融入目标环境描述文本相对应的目标环境信息;基于多条所述目标语音信息对扩散模型进行训练处理,得到用于预测所述目标环境信息中夹杂噪声的目标扩散模型;基于所述目标扩散模型对所述待处理语义文本进行环境融合处理,得到融合了所述目标环境信息的融合语音信息。
技术关键词
语音生成方法
文本
语义
关键字
声音信号处理技术
噪声
通信接口
编码
信息更新
存储器
生成装置
处理器
指令
模块
金融
解码
系统为您推荐了相关专利信息
智能问答方法
电力设备
电力系统运维
变电站内设备
数据
智能机器人
多模态
WebSocket协议
智能语音
音频特征