语音合成方法、语音合成装置、电子设备及存储介质

AITNT
正文
推荐专利
语音合成方法、语音合成装置、电子设备及存储介质
申请号:CN202510192346
申请日期:2025-02-20
公开号:CN119811361B
公开日期:2025-10-10
类型:发明专利
摘要
本申请提出的语音合成方法、语音合成装置、电子设备及存储介质,涉及人工智能技术领域及金融科技领域。该方法包括:通过初始说话人验证模型中的特征嵌入器对样本语音数据组进行说话人特征提取,得到样本组说话人特征;通过初始说话人验证模型中的特征分类器对样本组说话人特征进行说话人分类,得到样本验证说话人类别,然后对初始说话人验证模型进行参数调整,得到目标说话人验证模型;通过目标说话人验证模型中的特征嵌入器对目标语音数据进行说话人特征提取,得到目标说话人特征;根据目标说话人特征和目标文本特征进行语音生成,得到目标合成语音数据。本申请能够缓解语音数据中的背景噪声带来的不良影响,提高了语音合成的准确性。
技术关键词
语音 样本 噪声特征 验证说话人 背景噪声 噪声识别 说话人识别 数据获取模块 电子设备 分类器 文本 特征提取模块 参数 人工智能技术 强度 处理器 可读存储介质 存储器
系统为您推荐了相关专利信息
1
一种用于头戴式计算机的自适应降噪方法及装置
头戴式计算机 噪声频谱 梅尔频率倒谱系数 噪声源 降噪方法
2
一种茶叶生产线流量智能检测方法、设备、介质及产品
茶叶生产线 智能检测方法 二维图像数据 样本 三维图像数据
3
一种煤粉锅炉的节能降碳评价方法及系统
历史运行数据 指标 评价方法 初始聚类中心 k均值聚类算法
4
一种变后掠飞行器ADRC参数整定方法
深度强化学习 飞行器 参数整定方法 扩张状态观测器 仿真模型
5
基于可见光和多光谱智能识别林木病虫害的预警方法和装置
光谱特征参数 预测网络模型 多光谱 可见光图像 地面控制点
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号