摘要
本发明涉及语音合成技术领域,可应用于金融科技、医疗健康等业务系统平台中,公开了口语化语音合成方法、装置、设备及介质,按照预设情感标签对原始文本进行口语化改写,得到口语化文本;将口语化文本与预设的真实口语化文本进行损失计算,得到损失值,根据损失值对口语化文本进行调整,得到调整口语化文本;构建辅助情感标签,将调整口语化文本和辅助情感标签进行声学信号处理,得到文本声学特征。通过口语化文本改写,以及引入辅助情感标签并与文本自然融合,使得合成语音更加贴近人类自然交流中的表达方式,极大地丰富了语音的情感表现力和真实感。
技术关键词
文本
声学信号处理
标签
语音声学特征
情感特征
分词
映射关系表
可读存储介质
医疗健康
处理器
编码
模块
业务系统
计算机设备
真实感
语义
波形
存储器
系统为您推荐了相关专利信息
局部特征提取
显著性数据集
深度图
胶囊网络
语义
特征提取方法
特征提取系统
节点特征
标签
扫描模块