-
公开(公告)号:CN111626373B
公开(公告)日:2023-07-25
申请号:CN202010484081.2
申请日:2020-06-01
Applicant: 中国科学院自动化研究所
IPC: G06V10/774 , G06V10/40 , G06V10/82 , G06N3/0464
Abstract: 本发明属于机器学习领域,具体涉及一种多尺度加宽残差网络、小目标识别检测网络及其优化方法,本发明多尺度加宽残差网络包括串行连接的多尺度加宽卷积层、多尺度加宽残差网络单元结构;所述多尺度加宽卷积层,包括并行设置的多个不同尺度的卷积核,其输出为所述多个不同尺度的卷积核提取特征的合并;所述多尺度加宽残差网络单元结构,包括多个串联设置的所述多尺度加宽卷积层,设定两个所述多尺度加宽卷积层之间跃层连接,以直接将两层输出特征取大融合。基于本发明得到的特征进行小目标识别检测,可以提高小目标物体识别的准确度。
-
公开(公告)号:CN114170112A
公开(公告)日:2022-03-11
申请号:CN202111548137.7
申请日:2021-12-17
Applicant: 中国科学院自动化研究所
Abstract: 本申请实施例公开了一种修复图像的方法、装置以及存储介质。其中,该方法包括:根据待修复图像预测目标掩膜图像,所述目标掩膜图像包括与所述待修复图像的像素一一对应的权重,任一所述权重大于或者等于0且小于或者等于1,根据所述目标掩膜图像对所述待修复图像进行编码,得到所述待修复图像的编码特征图,所述编码特征图的每个特征值均是所述待修复图像的相应特征值与所述目标掩膜图像中对应的权重相乘得到,对所述编码特征图解码得到所述待修复图像对应的修复图像,解决了提取的待修复图像的特征准确性的问题,即提取的待修复图像的特征准确性较好。
-
公开(公告)号:CN111126494A
公开(公告)日:2020-05-08
申请号:CN201911360305.2
申请日:2019-12-25
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及深度学习与图像分类领域,具体涉及一种基于各向异性卷积的图像分类方法及系统,目的在于解决当图像分辨率低、物体尺度和形态多变等情况下难以保证物体分类识别的精度的问题。本发明的图像分类方法包括:步骤A1,根据设定的标准图像大小,将训练图像与待分类图像都进行预处理;步骤A2,利用利用损失函数与预处理后的训练样本对神经网络进行训练优化,其中,神经网络包括各向异性卷积层;步骤A3,利用训练好的神经网络对预处理后的待分类图像进行特征提取与图像分类。本发明的神经网络能快速提取判别性特征因子,准确锁定图像中的物体轮廓,较好应对小图像、多形变等分类难题,从而充分挖掘了图像的空间信息,提高了物体分类的准确度。
-
公开(公告)号:CN110215216A
公开(公告)日:2019-09-10
申请号:CN201910500528.8
申请日:2019-06-11
Applicant: 中国科学院自动化研究所
IPC: A61B5/11
Abstract: 本发明属于计算机视觉领域,具体涉及一种基于骨骼关节点分区域分层次的行为识别方法、系统、装置,旨在为了解决有效提高行为识别准确率同时减少网络层数的问题。本发明方法包括:获取输入视频的各帧图像,从各帧图像中分别提取骨骼关节点;对每一帧图像,将其中所提取的所述骨骼关节点划分至所划分的各人体区域,并通过图卷积操作获取对应的特征表示,得到第一层特征表示集;对每一帧图像,按照所述各人体区域,基于所述第一层特征表示,通过池化、图卷积方法逐层减少关节点数量,直至通过多层聚合得到一个特征向量,并将该特征向量输入到两个全连接层得到行为类别。本发明提高了行为识别的准确率,加快了训练速度与检测速度。
-
公开(公告)号:CN119339100A
公开(公告)日:2025-01-21
申请号:CN202411371157.5
申请日:2024-09-29
Applicant: 中国科学院自动化研究所 , 人民中科(北京)智能技术有限公司
IPC: G06V10/44 , G06V10/764 , G06V10/80 , G06N3/045 , G06N3/0464 , G06N3/049
Abstract: 本发明涉及神经网络技术领域,公开了一种基于SNN信息补充的图像识别方法、装置、设备及介质,该方法包括:获取目标图像,并输入图像识别模型中的脉冲神经网络和卷积神经网络,进行特征提取并前向传播;在每个对应处理阶段,对脉冲神经网络和卷积神经网络中当前处理阶段各自对应的输入特征进行处理,得到第一特征和第二特征,将其合并为第三特征,将第三特征和第二特征分别输出至脉冲神经网络和卷积神经网络的下一处理阶段;当脉冲神经网络的最后的处理阶段得到目标特征后,通过其全连接层基于目标特征确定目标图像的分类结果,本发明通过卷积神经网络为脉冲神经网络每个阶段提取的特征提供补充特征,从而提高脉冲神经网络的图像处理性能。
-
公开(公告)号:CN119169045A
公开(公告)日:2024-12-20
申请号:CN202411283206.X
申请日:2024-09-12
Applicant: 中国科学院自动化研究所 , 人民中科(北京)智能技术有限公司
Abstract: 本公开提供一种基于类脑脉冲的光流估计方法、装置、介质和计算机设备。光流估计方法包括:获取事件相机数据和帧相机数据;通过脉冲神经网络从事件相机数据提取第一特征;通过卷积神经网络从帧相机数据提取第二特征;拼接第一特征和第二特征,以获得第三特征并且利用残差网络对第三特征进行转换,以获得转换特征;利用光流细化网络对转换特征、脉冲神经网络的除了输出层之外的至少一层提取的特征和卷积神经网络的除了输出层之外的至少一层提取的特征进行光流细化,以生成光流场。
-
公开(公告)号:CN118520153B
公开(公告)日:2024-12-06
申请号:CN202410972733.5
申请日:2024-07-19
Applicant: 中国科学院自动化研究所
IPC: G06F16/903 , G06N3/0455 , G06N3/08
Abstract: 本发明提供一种NFT跨模态检索方法、装置及存储介质,涉及电数字数据处理技术领域,所述方法包括:获取用于检索的语义信息;将所述语义信息输入至NFT跨模态检索模型中,基于置信累加两阶段搜索算法获取与语义信息最为匹配的NFT检索结果,所述NFT跨模态检索模型是基于动态组件差分训练得到的。本发明提供的NFT跨模态检索方法、装置及存储介质,可以根据动态组件差分训练得到NFT跨模态检索模型,然后根据NFT跨模态检索模型通过置信累加两阶段搜索算法,从而能够根据用户输入的语义信息输出与之最为匹配的检索结果,可以提高NFT图像的检索精度。
-
公开(公告)号:CN118378153B
公开(公告)日:2024-12-06
申请号:CN202410834192.X
申请日:2024-06-26
Applicant: 中国科学院自动化研究所 , 人民中科(北京)智能技术有限公司
IPC: G06F18/241 , G06N3/0464 , G06N3/049
Abstract: 本发明提供一种地面材质识别方法、装置、电子设备及存储介质,涉及数据处理技术领域,所述方法包括:采集待识别地面材质引气的压力变化时序数据,将预处理后的压力变化时序数据输入训练好的1D‑SNN模型进行地面材质识别,得到识别结果;其中,1D‑SNN模型是基于1D‑CNN和脉冲神经元构建的,1D‑CNN用于提取压力变化时序数据的局部时序特征,脉冲神经元用于提取压力变化时序数据的全局时序特征。本发明在面对地面材质的多样性和环境的复杂性时,有效提升地面材质识别的准确性和稳定性,进而增强智能车辆的适应性和安全驾驶能力。
-
公开(公告)号:CN112203089A
公开(公告)日:2021-01-08
申请号:CN202011396914.6
申请日:2020-12-03
Applicant: 中国科学院自动化研究所
IPC: H04N19/115 , H04N19/146 , H04N19/91
Abstract: 本发明属于数字图像处理技术领域,具体涉及了一种基于稀疏编码的码率控制的图像压缩方法、系统及装置,旨在解决现有遥感图像压缩码率不易控制且码率分配不合理,导致遥感图像压缩效率低,压缩后图像重建质量低的问题。本发明包括:将待编码图像划分为设定大小,并进行编码参数设定;提取图像块均值并进行量化和熵编码;每次更新图像实际编码码率后,与设定目标码率进行比较,并根据比较结果确定下一步操作;每次迭代编码时,选取复杂度较高的图像块进行稀疏编码,其数量由当前图像实际编码码率、设定目标码率和系数共同决定;在设定的编码码率下完成图像编码。本发明编码码率精准可控,分配合理并能动态调整,可以实现图像的高效、高质量压缩。
-
公开(公告)号:CN114219936B
公开(公告)日:2025-03-28
申请号:CN202111266514.8
申请日:2021-10-28
Applicant: 中国科学院自动化研究所 , 人民中科(济南)智能技术有限公司
IPC: G06V10/25 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/0895
Abstract: 本发明提供一种目标检测方法、电子设备、存储介质和计算机程序产品,方法包括获取包含待检测目标的待检测图像;将所述待检测图像输入至目标检测模型,进行目标检测,获得所述目标检测模型输出的目标检测结果,所述目标检测模型是基于候选框及其对应的正负标签训练得到的,所述正负标签是基于所述候选框与所述候选框对应的真实框的交并比,以及动态变化的交并比阈值确定得到的。本发明通过动态变化的交并比阈值,动态变化候选框的正负标签,以使最后分配给候选框的正负标签为准确标签,从而提高候选框的标签分配准确度,进而提高目标检测模型的召回率,最终实现高性能的目标检测。
-
-
-
-
-
-
-
-
-