-
公开(公告)号:CN111612770A
公开(公告)日:2020-09-01
申请号:CN202010440471.X
申请日:2020-05-22
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于医学图像处理和深度学习领域,具体涉及一种基于主动筛选的半监督病灶检测网络的病灶检测系统、方法、装置,旨在解决现有的病灶检测网络训练难度大、检测精度较低的问题。本系统包括:检测模块,配置为获取待检测的CT图像,通过预训练的病灶检测网络获取病灶的检测结果;所述病灶检测网络基于U-Net卷积神经网络构建。本发明降低了病灶检测网络的训练难度,提高了检测精度。
-
公开(公告)号:CN111612075A
公开(公告)日:2020-09-01
申请号:CN202010444152.6
申请日:2020-05-22
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于计算机视觉领域,具体涉及一种基于联合特征重组和特征混合的兴趣点、描述符提取方法、系统、装置,旨在解决现有的兴趣点、描述符提取方法检测提取精度较低的问题。本系统方法包括:获取待提取的图像,作为输入图像,并通过特征提取网络提取该图像的多尺度特征图;对各特征图进行像素重组,通过卷积、非线性映射,得到得分图,并通过非最大抑制得到兴趣点;对输入图像中各像素点,获取其在多尺度特征图相应位置的特征向量进行连接,并通过连接层对连接后的特征向量进行过滤并压缩,得到各像素点对应的描述符。本发明提高了兴趣点、描述符检测提取的精度。
-
公开(公告)号:CN111476835A
公开(公告)日:2020-07-31
申请号:CN202010437242.2
申请日:2020-05-21
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于领域,具体涉及了一种多视角图像一致性的无监督深度预测方法、系统、装置,旨在解决深度预测中监督方法费时费力,而无监督方法预测结果精度低的问题。本发明包括:基于无监督密集深度网络以及无监督姿态网络构建图像深度预测网络;获取多个不同视图的图像簇集合作为训练样本集合;结合图像簇中不同视角图像的颜色一致性、深度一致性及深度平滑损失构建总损失函数;进行无监督的深度预测网络的训练;通过训练好的网络获取输入图像的预测深度。本发明避开了监督学习方法中需要的高质量大规模数据集和相应真值深度标注,降低成本、提高效率,同时结合了多视图的颜色一致性、深度一致性和深度平滑损失,实现了高精度无监督的深度预测。
-
公开(公告)号:CN117974996A
公开(公告)日:2024-05-03
申请号:CN202311844162.9
申请日:2023-12-28
Applicant: 中国科学院自动化研究所
IPC: G06V10/26 , G06V10/774 , G06V20/40 , G06V10/82 , G06N3/0455 , G06N3/08
Abstract: 本发明提供一种语义分割模型训练方法、语义分割方法及相关装置,该语义分割模型训练方法包括:获取视频图像序列帧;分别对源域数据和目标域数据进行编码得到多个域特征,将多个域特征进行拼接得到语义亲和力图;根据语义亲和力图和对应解码器的分割预测输出得到域超相关表示,根据域超相关表示确定目标学习损失函数;根据源域数据、目标域数据和目标学习损失函数分别训练源域编码器和目标域编码器得到语义分割模型。本发明所述方法能够利用源域网络和目标域网络互学习提高模型的泛化能力,并通过最小化源域和目标域超相关表示的距离来学习稳健表示,利用联合互学习损失促进了交互式知识传递,增强了模型捕捉有利的语义表示的能力。
-
公开(公告)号:CN111476835B
公开(公告)日:2021-08-10
申请号:CN202010437242.2
申请日:2020-05-21
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于领域,具体涉及了一种多视角图像一致性的无监督深度预测方法、系统、装置,旨在解决深度预测中监督方法费时费力,而无监督方法预测结果精度低的问题。本发明包括:基于无监督密集深度网络以及无监督姿态网络构建图像深度预测网络;获取多个不同视图的图像簇集合作为训练样本集合;结合图像簇中不同视角图像的颜色一致性、深度一致性及深度平滑损失构建总损失函数;进行无监督的深度预测网络的训练;通过训练好的网络获取输入图像的预测深度。本发明避开了监督学习方法中需要的高质量大规模数据集和相应真值深度标注,降低成本、提高效率,同时结合了多视图的颜色一致性、深度一致性和深度平滑损失,实现了高精度无监督的深度预测。
-
公开(公告)号:CN108154488B
公开(公告)日:2019-10-22
申请号:CN201711438764.9
申请日:2017-12-27
Applicant: 西北工业大学 , 中国科学院自动化研究所
Abstract: 本发明提供了一种基于显著图像块分析的图像运动模糊去除方法,涉及图像处理领域,本发明生成超像素,利用基于密度的聚类算法融合成一个超像素,以超像素为单位进行兴趣图计算;获得所有图层的兴趣图后,将兴趣图按权重进行线性叠加,本发明将选取显著图像块的方法应用于去模糊算法的输入,与去模糊算法相结合,实现最终的图像恢复过程,最终得到图像前景区域更加自然的模糊去除结果。本发明有效恢复模糊图像中人眼感兴趣的前景部分,核估计速度大幅提高。
-
公开(公告)号:CN118644546A
公开(公告)日:2024-09-13
申请号:CN202410682428.2
申请日:2024-05-29
Applicant: 中国科学院自动化研究所
IPC: G06T7/70 , G06T15/02 , G06T7/73 , G06T7/90 , G06N3/0499
Abstract: 本发明提供一种三维姿态优化方法及装置,该三维姿态优化方法包括:对目标物体的姿态数据进行平移和旋转,得到多视角姿态,并采用渲染模型对多视角姿态进行渲染,得到第一渲染图像;渲染模型采用亲和损失函数结合上下文信息对神经辐射场NeRF进行迭代训练得到;根据目标物体对应图像与第一渲染图像之间的颜色和几何损失对姿态数据进行优化,得到优化后的姿态数据;本发明所述方法能够更充分地利用几何约束及捕捉场景中相邻点之间的关系,促进局部一致性,减少了局部模型的偏差,提高了姿态估计的准确性和鲁棒性。
-
公开(公告)号:CN117975054A
公开(公告)日:2024-05-03
申请号:CN202311868848.1
申请日:2023-12-29
Applicant: 中国科学院自动化研究所
Abstract: 本申请公开了一种视频相似度确定方法和装置,其中方法包括:获取第一视频的关键帧;对关键帧进行实例级的语义分割,得到关键帧中各个实例的语义标签;基于语义标签和各个实例之间的位置关系构建关键帧的知识图谱;对知识图谱中各个节点进行聚类,以及将属于同一第一视频的知识图谱进行聚类,并基于聚类结果在第二视频集合中选取候选视频;基于候选视频的候选关键帧的全局图像特征与第一视频的关键帧的全局图像特征,确定第一视频与候选视频之间的相似度。本申请提供的方法和装置,提高了视频相似度的确定效率和确定准确度。
-
公开(公告)号:CN116958925A
公开(公告)日:2023-10-27
申请号:CN202310935557.3
申请日:2023-07-27
Applicant: 中国科学院自动化研究所
IPC: G06V20/56 , G06V10/44 , G06V10/80 , G06V10/28 , G06N3/0455 , G06N3/0464 , G06N3/048 , G06N3/08 , G06T7/66 , G06T7/60
Abstract: 本发明提供一种基于协同感知噪声位姿鲁棒矫正的目标检测方法和装置,方法包括:获取自车的自车点云数据,以及连接车的转换点云数据,转换点云数据是基于自车的位姿信息进行视角转换得到;分别对自车点云数据的特征图和转换点云数据的特征图进行特征生成,得到自车的空间置信图和连接车的空间置信图,从空间置信图中定位区域中心点;匹配自车的区域中心点和连接车的区域中心点,基于匹配结果确定细粒度转换矩阵;基于细粒度转换矩阵,对连接车的伪图像表征进行位姿误差矫正,得到矫正伪图像表征;基于自车的伪图像表征和连接车的矫正伪图像表征,进行目标检测。本发明提供的方法和装置,实现了无需额外增加训练且滤除噪声数据、高精度的目标检测。
-
公开(公告)号:CN116758092A
公开(公告)日:2023-09-15
申请号:CN202310532254.7
申请日:2023-05-11
Applicant: 中国科学院自动化研究所
IPC: G06T7/11 , G06V10/44 , G06N3/0464
Abstract: 本发明提供一种图像分割方法、装置、电子设备及存储介质,其中方法包括:获取待分割图像;将所述待分割图像输入至图像特征提取模型,得到所述图像特征提取模型输出的图像特征;基于所述图像特征,对所述待分割图像进行图像分割;所述图像特征提取模型包括并行的三分支注意力机制、视觉转换器和卷积模型,所述三分支注意力机制用于提取所述待分割图像的令牌对应的令牌特征信息,所述视觉转换器用于提取所述待分割图像的全局特征信息,所述卷积模型用于提取所述待分割图像的局部特征信息。本发明提供的方法、装置、电子设备及存储介质,提高了图像特征涵盖的特征信息的全面性,进一步提高了图像特征的提取质量,提高了图像分割的准确性和可靠性。
-
-
-
-
-
-
-
-
-