-
公开(公告)号:CN119545285A
公开(公告)日:2025-02-28
申请号:CN202411668122.8
申请日:2024-11-21
Applicant: 南京大学
IPC: H04S1/00 , H04S3/00 , H04S7/00 , G06V40/10 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于自动编码器和球谐展开的HRTF重建装置及方法。其装置包括:变分自动编码器,用于根据耳部图片获得耳廓特征的编码表示;球谐系数展开模块,用于将HRTF使用球谐函数展开成球谐系数;预测模块,用于根据变分自动编码器输出的图片编码表示预测HRTF球谐展开系数;重建模块,用于将预测模块预测的球谐展开系数重建为HRTF幅度,然后根据听者的头部宽度进行HRTF相位的个性化,从而获得完整的HRTF。本发明使用球谐函数对HRTF进行降维表示,降维后能够使模型训练更容易,并且理论上可以使用预测的球谐展开系数得到全空间的HRTF。