一种基于多模态信息的空间音频播放系统评价方法和装置

正文

推荐专利

申请号：CN202511367272

申请日期：2025-09-24

公开号：CN120873494A

公开日期：2025-10-31

类型：发明专利

摘要

本发明公开了一种基于多模态信息的空间音频播放系统评价方法和装置，属于空间音频理解领域。获取多场景下的训练集，利用空间音频编码器，提取声学与空间线索，捕捉细粒度的感知模式来实现空间音频表征，生成空间音频嵌入特征和编码后的条件嵌入特征；基于空间音频嵌入特征完成第一阶段训练；再由声音‑视觉协同编码器对播放环境全景图像空间特征、空间音频嵌入特征和编码后的条件嵌入特征进行声音‑视觉协同编码，得到视觉音频联合嵌入特征；基于视觉音频联合嵌入特征完成第二阶段训练。本发明可用于有效指导室内场景下空间音频播放系统的质量优化，解决了现有技术中对空间音频播放系统的声场、声像感知维度评价不足的问题。

技术关键词

嵌入特征音频播放系统多模态信息评价方法频谱特征音频编码器双声道立体声视觉前馈神经网络查询特征路由器编码块距离估计计算机电子设备频率

系统为您推荐了相关专利信息

一种航空机载微型5G自组网多模通信终端

多模通信终端势场数据节点链路子模块

基于压缩采样重构特征的调制模式识别方法

调制模式识别方法偏最小二乘回归算法频谱特征矩阵非线性

一种航班地服保障车辆调度的确定方法、装置、设备及介质

混合整数线性规划模型嵌入特征样本神经网络模型车辆

一种联合实体类别与关系表示的知识图谱实体补全方法

嵌入特征实体三元组标签补全方法

一种基于深度学习的低资源语言翻译方法

语言翻译方法多头注意力机制神经网络模型融合特征解码器

一种基于多模态信息的空间音频播放系统评价方法和装置

站点导航

APP 下载