-
公开(公告)号:CN118095390A
公开(公告)日:2024-05-28
申请号:CN202410115171.2
申请日:2024-01-26
Applicant: 吉林大学
IPC: G06N3/08 , G06N3/0455 , G06N3/047 , G06N3/0475 , G06T11/00 , G06V40/16 , G06V10/44
Abstract: 本发明涉及图像处理技术领域,特别是指一种熵正则化最优传输的变分自编码器表征学习方法及装置,包括:获取原始图像;构建变分自编码器,对变分自编码器进行基于熵正则化的最优传输的表征学习,获得改进后的变分自编码器;将原始图像输入至改进后的变分自编码器,输出特征图像。本发明使用一种简单的对偶随机梯度算法求解熵正则化后的对偶最优传输距离。其收敛速度不仅比辛克豪恩算法更快,而且也能支持大量的数据计算。同时,最优传输距离克服了KL散度在计算时的缺点,同时最优传输距离考虑了底层数据的几何结构,并根据数据样本之间的实际距离计算两个分布之间的差异,提高了表征学习的效果。