-
公开(公告)号:CN117934983A
公开(公告)日:2024-04-26
申请号:CN202311719966.6
申请日:2023-12-14
Applicant: 北京交通大学
IPC: G06V10/77 , G06V10/764 , G06V10/82
Abstract: 本发明提供一种基于最优传输理论的图像数据扩充方法及系统,属于图像处理技术领域,将自编码器与最优传输理论相结合,把图像生成的第二个任务:概率分布转换使用最优传输理论进行替换。由自编码器完成流形学习,最优传输映射完成概率分布转换。本发明使用蒙特卡洛方法建立了半离散最优传输映射网络,该网络将连续的白噪声分布映射为数据在隐空间内离散的分布,解决神经网络使用连续映射逼近不连续分布的问题。最后,对本发明提出的基于最优传输理论的图像数据扩充方法生成的的图像数据进行测试与分析,本发明解决了图像生成中出现的模式崩溃与模式混杂问题,通过测试结果分析验证了本发明的有效性。
-
公开(公告)号:CN118918116A
公开(公告)日:2024-11-08
申请号:CN202410793929.8
申请日:2024-06-19
Applicant: 北京交通大学
IPC: G06T7/10 , G06V10/774 , G06N3/0464 , G06N3/0455 , G06V10/80 , G06V10/764
Abstract: 本发明提供一种基于多尺度注意力机制的轨道板裂缝分割方法及系统,属于基于计算机视觉的图像分割技术领域,本发明该方法针对轨道板裂缝在无人机图像中像素占比小的问题,利用在大规模数据集上预训练好的神经网络作为编码器,提升模型对于裂缝细节信息的提取与表征,采用基于混合注意力机制的特征融合模块,使得模型可以排除背景冗余信息的干扰,专注于裂缝特征以提升轨道板裂缝分割精度,并引入Focal loss和Dice loss损失函数以解决裂缝分割任务中正负样本不平衡以及正样本难以学习的问题。
-