一种基于自动编码器和球谐展开的HRTF重建装置及方法

AITNT
正文
推荐专利
一种基于自动编码器和球谐展开的HRTF重建装置及方法
申请号:CN202411668122
申请日期:2024-11-21
公开号:CN119545285A
公开日期:2025-02-28
类型:发明专利
摘要
本发明公开了一种基于自动编码器和球谐展开的HRTF重建装置及方法。其装置包括:变分自动编码器,用于根据耳部图片获得耳廓特征的编码表示;球谐系数展开模块,用于将HRTF使用球谐函数展开成球谐系数;预测模块,用于根据变分自动编码器输出的图片编码表示预测HRTF球谐展开系数;重建模块,用于将预测模块预测的球谐展开系数重建为HRTF幅度,然后根据听者的头部宽度进行HRTF相位的个性化,从而获得完整的HRTF。本发明使用球谐函数对HRTF进行降维表示,降维后能够使模型训练更容易,并且理论上可以使用预测的球谐展开系数得到全空间的HRTF。
技术关键词
变分自动编码器 编码器模块 耳部 图片 球谐函数展开 球谐系数 一维卷积神经网络 深度神经网络模型 输入解码器 重构 频率 网格 数据 样本
系统为您推荐了相关专利信息
1
一种大肠癌的辅助诊断方法和系统
图像分析模型 图片 患者 辅助诊断方法 诊断模块
2
一种车机3D地图可见即可说功能识别所用词汇库获取方法
车机 地图界面 图片 街道 智能座舱
3
一种空间治理场景高质量图片生成方法及装置
图片生成方法 图像增强模块 样本 数据获取模块 图片生成装置
4
一种卷烟库存的人工智能识别方法
人工智能识别方法 网格模型 鲁棒识别方法 卷烟 端头
5
基于计算机视觉技术的道路病害巡查工单去重的解决方法
计算机视觉技术 道路病害 识别终端 蒙特卡罗算法 偏差
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号