摘要
本发明公开了一种基于自动编码器和球谐展开的HRTF重建装置及方法。其装置包括:变分自动编码器,用于根据耳部图片获得耳廓特征的编码表示;球谐系数展开模块,用于将HRTF使用球谐函数展开成球谐系数;预测模块,用于根据变分自动编码器输出的图片编码表示预测HRTF球谐展开系数;重建模块,用于将预测模块预测的球谐展开系数重建为HRTF幅度,然后根据听者的头部宽度进行HRTF相位的个性化,从而获得完整的HRTF。本发明使用球谐函数对HRTF进行降维表示,降维后能够使模型训练更容易,并且理论上可以使用预测的球谐展开系数得到全空间的HRTF。
技术关键词
变分自动编码器
编码器模块
耳部
图片
球谐函数展开
球谐系数
一维卷积神经网络
深度神经网络模型
输入解码器
重构
频率
网格
数据
样本
系统为您推荐了相关专利信息
图片生成方法
图像增强模块
样本
数据获取模块
图片生成装置
人工智能识别方法
网格模型
鲁棒识别方法
卷烟
端头
计算机视觉技术
道路病害
识别终端
蒙特卡罗算法
偏差