语音转换方法以及装置

AITNT
正文
推荐专利
语音转换方法以及装置
申请号:CN202511242460
申请日期:2025-09-01
公开号:CN120954387A
公开日期:2025-11-14
类型:发明专利
摘要
本申请公开了一种语音转换方法以及装置,方法包括:将帧级声学特征序列与音素级文本特征序列对齐,以生成关注内容信息的音素级声学特征序列;基于音素级文本特征序列、音素级声学特征序列、目标对象标识,生成同时携带内容和声学信息的音素级隐变量序列;将音素级隐变量序列输入训练好的时长预测网络,得到与音素级隐变量序列对应的预测时长序列;基于预测时长序列对音素级隐变量序列中各个音素级隐变量进行时长拓展,得到帧级隐变量序列;基于帧级隐变量序列生成与目标对象标识对应的目标音频;本申请既能保留源音频的情感,不泄露音色,又能生成更接近目标说话人韵律和音色的音频。
技术关键词
声学特征 序列 变量 文本 语音转换方法 音频 标识 对象 文字特征 语音转换装置 网络 存储计算机程序 指令 计算机程序产品 处理器 模块 数据 语义特征 可读存储介质 存储器
系统为您推荐了相关专利信息
1
模型训练方法及敏感信息的识别方法
敏感信息识别 模型训练方法 指标 数据 非易失性存储介质
2
云平台运维风险的大数据分析与自动化决策方案生成方法
图谱 生成方法 决策 云平台运维 表征系统
3
一种基于脑电图和微表情的多模态情绪识别和意识检测方法
意识障碍患者 表情特征 多通道脑电信号 头皮脑电信号 原始脑电信号
4
数据处理方法、装置及电子设备
文本 数据处理方法 摘要 节点 语义向量
5
一种电力设备故障预测知识图谱更新方法
知识图谱更新方法 电力设备故障 统计模式识别 实体 电力智能运维技术
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号