一种基于多模态信息的空间音频播放系统评价方法和装置

AITNT
正文
推荐专利
一种基于多模态信息的空间音频播放系统评价方法和装置
申请号:CN202511367272
申请日期:2025-09-24
公开号:CN120873494A
公开日期:2025-10-31
类型:发明专利
摘要
本发明公开了一种基于多模态信息的空间音频播放系统评价方法和装置,属于空间音频理解领域。获取多场景下的训练集,利用空间音频编码器,提取声学与空间线索,捕捉细粒度的感知模式来实现空间音频表征,生成空间音频嵌入特征和编码后的条件嵌入特征;基于空间音频嵌入特征完成第一阶段训练;再由声音‑视觉协同编码器对播放环境全景图像空间特征、空间音频嵌入特征和编码后的条件嵌入特征进行声音‑视觉协同编码,得到视觉音频联合嵌入特征;基于视觉音频联合嵌入特征完成第二阶段训练。本发明可用于有效指导室内场景下空间音频播放系统的质量优化,解决了现有技术中对空间音频播放系统的声场、声像感知维度评价不足的问题。
技术关键词
嵌入特征 音频播放系统 多模态信息 评价方法 频谱特征 音频编码器 双声道 立体声 视觉 前馈神经网络 查询特征 路由器 编码块 距离估计 计算机电子设备 频率
系统为您推荐了相关专利信息
1
一种航空机载微型5G自组网多模通信终端
多模通信终端 势场数据 节点 链路 子模块
2
基于压缩采样重构特征的调制模式识别方法
调制模式识别方法 偏最小二乘回归算法 频谱特征 矩阵 非线性
3
一种航班地服保障车辆调度的确定方法、装置、设备及介质
混合整数线性规划模型 嵌入特征 样本 神经网络模型 车辆
4
一种联合实体类别与关系表示的知识图谱实体补全方法
嵌入特征 实体 三元组 标签 补全方法
5
一种基于深度学习的低资源语言翻译方法
语言翻译方法 多头注意力机制 神经网络模型 融合特征 解码器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号