-
公开(公告)号:CN117218409B
公开(公告)日:2025-02-07
申请号:CN202311040570.9
申请日:2023-08-17
Applicant: 中国科学院自动化研究所
IPC: G06V10/764 , G06V10/74 , G06V10/82 , G06N3/0464
Abstract: 本发明提供一种图像分类网络架构设计方法、装置、设备和介质,采用候选子搜索空间来组织对架构的搜索,从中找到一个小而有效的子搜索空间,再迭代地进行架构修改和子搜索空间更新,可自适应地调整子搜索空间中的神经网络架构,极大地提高了神经架构搜索的有效性和计算效率,突破了现有技术在预定义的超大搜索空间中搜索效率低的问题。此外,本发明使用了图卷积神经网络的方法,以候选子搜索空间为节点,可高效地编码神经网络架构之间的关系信息,其所学习的判别特征有利于利用循环神经网络来确定如何修改网络构架。
-
公开(公告)号:CN114926843B
公开(公告)日:2024-12-10
申请号:CN202210450715.1
申请日:2022-04-26
Applicant: 中国科学院自动化研究所
IPC: G06V30/18 , G06V30/19 , G06V10/44 , G06V10/764 , G06V10/82 , G06T11/20 , G06N3/0464 , G06N3/048 , G06N3/094
Abstract: 本发明提供一种手写文本图像生成方法、装置、电子设备和存储介质,其中方法包括:确定内容文本和参考手写文本图像;基于手写文本图像生成模型,应用所述参考手写文本图像中相邻字符之间的位置关系,分别对所述内容文本和参考手写文本图像进行特征提取,并应用提取得到的特征生成目标手写文本图像。本发明实施例提供的手写文本图像生成方法、装置、电子设备和存储介质,相比于通过逐字符生成的方式,充分考虑到参考手写文本图像中相邻两字符之间的结构关联性,从而能够得到质量较高的目标手写文本图像,提高了手写文本图像生成的视觉合理性。
-
公开(公告)号:CN118396835A
公开(公告)日:2024-07-26
申请号:CN202410265853.1
申请日:2024-03-08
Applicant: 中国科学院自动化研究所
IPC: G06T3/04 , G06V10/26 , G06V10/774 , G06V10/80 , G06V10/82 , G06T7/11 , G06T7/136 , G06N3/0455 , G06N3/0464 , G06N3/084
Abstract: 本发明提供一种图像翻译模型构建方法、图像翻译方法和装置,构建方法包括:获取训练样本组;基于初始模型中的编码模块,提取可见光样本图像的图像特征;获取提示特征、可学习的掩码输出特征和红外输出特征,并将提示特征、掩码输出特征和红外输出特征进行拼接,得到拼接特征;基于图像特征和拼接特征分别进行掩码图像预测和红外图像预测,分别得到预测掩码图像和预测红外图像;基于红外标签图像与预测红外图像之间的差异,以及掩码标签图像与预测掩码图像之间的差异,对初始模型进行参数迭代,得到图像翻译模型。本发明提供的方法和装置,能够实现交互式图像翻译,且能提升图像翻译的精度。
-
公开(公告)号:CN117218409A
公开(公告)日:2023-12-12
申请号:CN202311040570.9
申请日:2023-08-17
Applicant: 中国科学院自动化研究所
IPC: G06V10/764 , G06V10/74 , G06V10/82 , G06N3/0464
Abstract: 本发明提供一种图像分类网络架构设计方法、装置、设备和介质,采用候选子搜索空间来组织对架构的搜索,从中找到一个小而有效的子搜索空间,再迭代地进行架构修改和子搜索空间更新,可自适应地调整子搜索空间中的神经网络架构,极大地提高了神经架构搜索的有效性和计算效率,突破了现有技术在预定义的超大搜索空间中搜索效率低的问题。此外,本发明使用了图卷积神经网络的方法,以候选子搜索空间为节点,可高效地编码神经网络架构之间的关系信息,其所学习的判别特征有利于利用循环神经网络来确定如何修改网络构架。
-
公开(公告)号:CN110084168B
公开(公告)日:2021-04-23
申请号:CN201910322445.4
申请日:2019-04-22
Applicant: 中国科学院自动化研究所
Abstract: 本发明是一种主动目标识别方法及装置,包括:在第一状态,通过学习获取目标识别性能与成像参数的关系;至少依据所述关系及目标识别性能,调整在第二状态的成像参数;以及当所述目标识别性能满足预定条件时,在第二状态完成成像和目标识别。本发明以提高目标识别性能为目的、通过学习成像参数与目标识别性能的隐式、复杂对应关系来改善目标识别性能、成像质量。本发明可以广泛应用于在轨成像和目标识别中。
-
公开(公告)号:CN111985731A
公开(公告)日:2020-11-24
申请号:CN202010940563.4
申请日:2020-09-09
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及一种城市公共交通站点人数的预测方法及系统,所述预测方法包括统计在训练时段内公共交通所有站点各时间区间内的站点人数,构建公共交通站点人数矩阵;根据公共交通站点人数矩阵,构建站点特征向量;根据站点特征向量对公共交通站点进行层次聚类,并确定监测站点;统计在预测时段内各监测站点的站点人数,构建预测时段内的监测站点人数向量;根据所述公共交通站点人数矩阵及预测时段内的监测站点人数向量,建立基于非负约束的稀疏岭回归模型;基于所述公共交通站点人数矩阵,根据时间相似度系数,预测所有站点的站点预测人数。本发明将公共交通站点的时空特征进行融合,同时考虑站点之间的空间关联性和时间依赖性,可提高预测的准确率。
-
公开(公告)号:CN105469369B
公开(公告)日:2018-03-06
申请号:CN201510872635.5
申请日:2015-11-27
Applicant: 中国科学院自动化研究所
IPC: G06T5/00
Abstract: 本发明公开了一种基于分割图的数字图像滤波方法和系统,其中,该方法包括步骤1:获取数字图像的超像素分割块;步骤2:在超像素分割块内进行聚合运算;步骤3:进行相邻超像素分割块之间的聚合运算;步骤4:计算相邻超像素分割块之间的加权平均。其中,步骤2具体包括:从超像素分割块内提取出最小生成树,并沿着最小生成树,在超像素分割块内进行聚合运算。步骤4具体包括:在数字图像上选定一窗口,根据窗口覆盖超像素分割块的面积,来计算超像素分割块间加权平均的权重,并对步骤3所得的结果进行加权平均。通过本发明,至少部分地解决了如何抑制纹理的技术问题。
-
公开(公告)号:CN105354571A
公开(公告)日:2016-02-24
申请号:CN201510695611.7
申请日:2015-10-23
Applicant: 中国科学院自动化研究所
IPC: G06K9/32
CPC classification number: G06K9/3283 , G06K2009/363
Abstract: 本发明公开了一种基于曲线投影的畸变文本图像基线估计方法,该方法至少包括:提取畸变文本图像的边缘图像;将所述边缘图像切分成条带图像;计算所述条带图像的投影图;根据所述投影图,估计所述条带图像的最优投影线;根据所述条带图像的所述最优投影线及边界线,得到所述畸变文本图像的基线。通过本发明,至少解决如何提取畸变文本图像弯曲基线的技术问题。
-
公开(公告)号:CN103236068A
公开(公告)日:2013-08-07
申请号:CN201310176573.5
申请日:2013-05-14
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开了一种用于融合多个局部图像特征描述子的图像匹配方法,包括:S1、对两个待匹配的局部图像,分别提取多种不同类型的局部图像特征描述子,然后将这些一维向量首尾相连,串联在一起,为每个局部图像得到一个描述向量;S2、对步骤S1得到的描述向量进行二值化,得到两个二值序列,其中每个二值序列称为其对应局部图像的混合特征描述子;S3、对步骤S2得到的两个混合特征描述子进行位异或操作,得到一个二值序列,作为差异向量;S4、根据步骤S3计算得到的差异向量,利用逻辑回归分析,计算所述两个局部图像属于匹配图像的概率。本发明的方法精度高、适用范围广、推广性强,可广泛应用于图像检索、物体识别、图像配准等系统中。
-
公开(公告)号:CN102156884B
公开(公告)日:2012-12-12
申请号:CN201110103720.7
申请日:2011-04-25
Applicant: 中国科学院自动化研究所
IPC: G06K9/62
Abstract: 本发明提供一种直线段检测和提取方法,所述方法包括步骤S1:对一幅扫描二值图像,计算二值图像像素点周围的游长直方图,并提取对应的游长方向与长度特征;步骤S2:对二值图像上每个前景像素点,构造一个圆弧形邻域结构,并利用像素点周围的游长特征进行局部直线段的检测;步骤S3:对检测到的局部直线段进行聚类合并,得到具有全局意义的长直线段。与传统方法相比,该技术仅需设置待检测直线段的最小长度,可有效的避免传统直线段检测方法中存在的虚检和漏检。本发明应用于票据图像中图形目标的自动检测和提取,在图形矢量化、表格分析、银行票据自动处理等领域有着广阔的应用前景。
-
-
-
-
-
-
-
-
-