一种基于薛定谔桥的空间音频合成方法及系统

AITNT
正文
推荐专利
一种基于薛定谔桥的空间音频合成方法及系统
申请号:CN202411954295
申请日期:2024-12-27
公开号:CN119964544B
公开日期:2025-10-10
类型:发明专利
摘要
本发明提供一种基于薛定谔桥的空间音频合成方法及系统,包括:获取单声道声源信号,基于所述单声道声源信号构建先验信号和带噪表征;将所述先验信号和带噪表征输入至预训练的空间音频合成模型,通过所述空间音频合成模型基于随机微分方程迭代式采样路径,生成最终的双声道空间音频;其中,所述空间音频合成模型是通过预定义的双声道薛定谔桥参数化目标和边界辅助监督对预设神经网络模型进行训练得到的。本发明解决了现有空间音频合成速度慢、质量不佳的问题。
技术关键词
音频 接收方 神经网络模型 双声道语音 信号 非暂态计算机可读存储介质 参数 处理器 坐标 计算机程序产品 噪声 多尺度 存储器 电子设备 顶点 模块 基础
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号