语音风格迁移方法、装置、设备及介质

AITNT
正文
推荐专利
语音风格迁移方法、装置、设备及介质
申请号:CN202510835571
申请日期:2025-06-20
公开号:CN120526748A
公开日期:2025-08-22
类型:发明专利
摘要
本发明涉及语音处理技术领域,可应用于金融科技及医疗健康等业务场景中,公开了一种语音风格迁移方法、装置、设备及介质,包括:获取源语音信号与目标风格特征,对源语音信号执行特征提取以生成源语音内容特征与潜在风格特征,对目标风格特征进行编码以生成编码后的目标风格特征,利用预训练的多模态大模型对源语音内容特征、潜在风格特征和编码后的目标风格特征进行风格解耦与迁移处理,生成迁移处理后的特征,基于迁移处理后的特征生成目标语音信号。本发明通过融合源语音的语义与风格信息,并结合编码后的目标风格特征执行风格迁移,利用多模态大模型实现内容与风格的有效解耦和自适应融合,提升了跨说话人、跨场景的语音迁移效果与实用性。
技术关键词
语音风格迁移方法 融合特征 音频特征 信号 梅尔频率倒谱系数 声学特征 执行语音识别 元学习策略 多模态 语义特征 文本 计算机设备 特征提取模块 医疗健康 数据获取模块 处理器 编码模块
系统为您推荐了相关专利信息
1
热泵控制设备和热泵系统
热泵控制设备 隔离电路 放大器 接地端 隔离模块
2
一种新能源发动机及车辆控制软件测试、标定的系统和方法
新能源发动机 通讯接口 仿真模型 模拟信号输出模块 数据模块
3
一种基于V2X的智能驾驶汽车用共享定位系统
智能驾驶汽车 设备主体 定位系统 车载设备 路边单元
4
基于多模态与对比学习的中药多标签毒性预测方法及系统
毒性预测方法 融合特征 中药 多标签 多模态
5
一种基于行人场景交互建模的行人轨迹预测方法及装置
行人轨迹预测方法 交互特征 场景特征 轨迹特征 场景语义分割
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号