多模态特征融合的高品质智能声线编辑方法及装置

AITNT
正文
推荐专利
多模态特征融合的高品质智能声线编辑方法及装置
申请号:CN202510674286
申请日期:2025-05-23
公开号:CN120375837A
公开日期:2025-07-25
类型:发明专利
摘要
本说明书实施例提供多模态特征融合的高品质智能声线编辑方法及装置,其中所述方法包括:根据针对原始音频的音色转换请求,确定所述原始音频对应的原始音色频谱,以及所述音色转换请求对应的目标音色频谱;基于所述音色转换请求确定所述原始音频对应的待调整频段,基于所述待调整频段利用所述目标音色频谱对所述原始音色频谱进行替换,获得音色控制频谱;在所述原始音频对应的初始音频特征中融合所述音色控制频谱,获得目标音频特征,并基于所述目标音频特征生成所述目标音色频谱对应的目标音频。使生成的目标音频能够在提高音频情感表现力效果的前提下,实现更高效、更准确以及更自然的音色转换。
技术关键词
音频特征 多模态特征融合 编辑方法 频段 计算机可执行指令 高品质 声码器 编辑装置 客户端 对象 处理器 服务端 计算机程序产品 注意力机制 模块 包络 模式 可读存储介质
系统为您推荐了相关专利信息
1
沙尘天气道路交通状况影响预测评估方法、装置及设备
道路交通状况 交通拥堵指数 预测评估方法 预测评估模型 气象站
2
一种无线智能电气设备组网与协同控制方法及系统、设备、可读存储介质
节点 拓扑图 智能电气设备 时隙分配策略 信道
3
跨模态语义对齐方法、系统和存储介质
对齐方法 跨模态 矩阵分解算法 嵌入特征 语义向量
4
一种基于磁各向异性的钢板力学性能无损检测方法、系统、设备及介质
力学性能无损检测方法 BP神经网络模型 采样点 增量磁导率 巴克豪森噪声信号
5
网格映射方法、系统、电子设备及介质
网格映射方法 启发式值 顶点 坐标系 衣物
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号