基于FTL损失函数和注意力的U-Net图像分割方法

    公开(公告)号:CN113538458A

    公开(公告)日:2021-10-22

    申请号:CN202110726063.5

    申请日:2021-06-29

    Abstract: 本发明公开了一种基于FTL损失函数和注意力的U‑Net图像分割方法。本发明对U‑Net模型进行重新设计,在U‑Net模型基础上结合FocalTverskyLoss和Attention注意力机制。本发明具体步骤:步骤1、图像预处理;步骤2、构建损失函数:用FTL损失函数来评价分割结果;步骤3、构建注意力机制:在模型的上采样过程中加入Attention注意力模块,使得模型在输出高水平特征图时不会丢失空间细节信息;步骤4、训练网络模型:将划分好的数据集输入到搭建好的网络模型中,通过训练集和验证集完成训练后,将测试集输入到网络模型中,得到分割结果。本发明改进了准确率和召回率的不平衡问题,并且对于多尺度输入的图像有更好的输出特征表示。

    一种使用自适应特征融合的RGB-D显著目标检测方法

    公开(公告)号:CN113538442A

    公开(公告)日:2021-10-22

    申请号:CN202110624851.3

    申请日:2021-06-04

    Abstract: 本发明公开了一种使用自适应特征融合的RGB‑D显著目标检测方法,首先使用2个结构相同的编码器网络分别对RGB图像和Depth图像这2个数据流编码,编码后对2个数据流分别获得m个层级的特征;然后在RGB和Depth两个数据流的解码过程中分别使用自适应特征融合;在联合数据流中对2个数据流的特征融合;最后使用损失函数对该网络模型优化。本发明所述的方法,可以提高RGB‑D显著目标检测的效果。通过使用自适应特征融合,可以有效融合数据流内不同层级的特征。通过使用数据流间特征融合方法,可以有效融合2个数据流的特征。

    一种基于稀疏向量矩阵计算的神经网络加速器及加速方法

    公开(公告)号:CN113537488A

    公开(公告)日:2021-10-22

    申请号:CN202110725493.5

    申请日:2021-06-29

    Abstract: 本发明公开了一种基于稀疏向量矩阵计算的神经网络加速器及加速方法。神经网络加速器包括多个稀疏向量矩阵计算单元,稀疏向量矩阵计算单元包括激活队列FIFO、地址读取单元、稀疏权重SRAM、算术运算单元、输出缓存模块、relu模块以及非零数据检测单元。本发明利用CSC稀疏数据压缩算法和稀疏向量矩阵计算单元,减少了计算量和对外部存储器的访问,对神经网络的inference进行加速,可以提高CNN的实时性,实现了更高的计算性能,同时降低了能耗。

    一种结合深度Q学习的机器人路径学习与避障系统及方法

    公开(公告)号:CN113419524A

    公开(公告)日:2021-09-21

    申请号:CN202110648635.2

    申请日:2021-06-10

    Abstract: 本发明公开了一种结合深度Q学习的机器人路径学习与避障系统及方法。本发明包括动作模块、学习模块和障碍物避险模块。在路径规划期间,动作模块会从学习模块和障碍物避险模块接收指令,并让机器人根据指令完成指定动作。学习模块根据机器人当前状态和动作的历史数据序列,训练动作选择策略。障碍物避险模块执行随机树搜索算法,以指导机器人从危险情况避险得到安全路径。每个模块在执行后,环境中机器人的当前状态都将发生变化。通过安排机制评估每个模块的风险并确定应激活风险最小的模块。本发明使用Q学习算法解决了大容量数据存储的问题。提高了机器人在避开障碍物时的效率问题。

    一种多全景图融合三维重建的方法

    公开(公告)号:CN113409442A

    公开(公告)日:2021-09-17

    申请号:CN202110522224.9

    申请日:2021-05-13

    Abstract: 本发明公开了一种多全景图融合三维重建的方法;首先通过扫描平台获取室内场景的RGB图与深度图;然后进行相机运动定位;通过对获取的室内场景的RGB图像以及对应的深度图进行预处理,以构建单张3D全景图;再进行多张全景图的数据获取及构建;之后进行多全景图融合,最后通过融合后的多全景图实现室内场景的抗噪三维重建完成。本发明方法结合了传统slam优质算法和基于3D全景图的优势,可以得到更为准确的室内场景重建效果,实现更高质量的重建,并且本发明方通过限定其运动一致性来共同跟踪未同步的相机,而无需依赖于明显的视差或快门同步,使得重建结果更加准确。

    一种基于注意力模块的高动态范围去重影成像系统及方法

    公开(公告)号:CN113160178A

    公开(公告)日:2021-07-23

    申请号:CN202110442869.1

    申请日:2021-04-23

    Abstract: 本发明公开了一种基于注意力模块的高动态范围去重影成像系统及方法,本发明将注意力网络应用于高动态范围去重影算法中,引导不同图像地融合,抑制图像地饱和与非对准区域;本发明创新性地提出了利用可学习的注意力网络来指导合并过程。利用注意力网络生成注意力映射,来评估不同图像区域对获得所需高动态范围图像的重要性,可以突出和参考图像互补的特征,来排除运动和严重饱和的区域,将具有注意力引导的低动态范围图像特征输入到融合网络中。利用空洞残差块来构造融合网络,有助于充分利用来自不同卷积层的信息,从而从输入的低动态范围图像中保留更多的细节,空洞卷积扩大了感受野,有助于恢复过饱和区域和运动造成的细节缺失。

    基于多模态正则化和温度平滑约束的三维场景重建方法

    公开(公告)号:CN119169208A

    公开(公告)日:2024-12-20

    申请号:CN202411690058.3

    申请日:2024-11-25

    Abstract: 本发明公开了基于多模态正则化和温度平滑约束的三维场景重建方法,属于计算机视觉技术领域。该方法首先对同一三维场景相同视角下的彩色‑温度图像对进行配准,然后通过混合或轮廓线叠加的方式生成增强的图像。对增强的图像进行运动构造,生成点云与相机位姿。再创建两个独立的高斯模型,输入点云数据和相机位姿,分别渲染得到温度图像和彩色图像。为温度模态和彩色模态的高斯模型设置损失函数,在温度模态的损失函数中引入平滑项。设置一个正则化系数,将温度模态和彩色模态的损失函数联立起来。利用总损失函数计算整体损失和梯度,并反向传播,通过自适应密度控制对模型的各项参数进行优化。最后使用训练后的模型完成三维场景的重建。

    一种基于混合存储器的联合训练跨域行人重识别方法

    公开(公告)号:CN113536979B

    公开(公告)日:2024-11-12

    申请号:CN202110720404.8

    申请日:2021-06-28

    Abstract: 本发明公开了一种基于混合存储器的联合训练跨域行人重识别方法,首先进行数据集预处理,通过源域数据集对在ImageNet上预训练的ResNet‑50进行预训练,获得baseline模型;然后将源域数据集和目标域数据集组合形成联合数据集,通过联合数据集对baseline模型进行训练并优化;本发明方法通过将源域和目标域数据集联合训练,可以进一步利用源域数据集中丰富的标注信息,同时可以进一步缩小域差异,从而实现更好的自适应效果;通过生成基于相似性和混合存储器的多类别标签,可以在源域和目标域同时搜索相似图像,进一步提高模型的性能,而且可以避免类似基于聚类算法中的聚类噪声。

Patent Agency Ranking