-
公开(公告)号:CN105118040A
公开(公告)日:2015-12-02
申请号:CN201510599577.3
申请日:2015-09-18
Applicant: 中国科学院自动化研究所
IPC: G06T5/00
Abstract: 本发明公开了一种基于结构激光线的文档图像畸变矫正方法,该方法至少包括:对相机内、外参数进行标定,并计算结构激光线所在的平面方程;获取文档图像;提取激光线;根据标定的相机内、外参数、所述结构激光线所在的平面方程以及所述提取的激光线,估计所述文档图像的3D页面准线;根据所述3D页面准线,对可展曲面进行插值;对所述插值的可展曲面进行展开;根据所述展开的可展曲面,对图像畸变进行矫正。通过本发明,至少解决如何矫正非平面文档图像的几何畸变的技术问题。
-
公开(公告)号:CN102930531A
公开(公告)日:2013-02-13
申请号:CN201210366913.6
申请日:2012-09-28
Applicant: 中国科学院自动化研究所
IPC: G06T7/00
Abstract: 本发明公开了一种建筑物表面图像重复结构检测方法,该方法包括如下步骤:按照用户标注的结构单元构建结构模板;利用结构模板所包含像素的颜色构建结构模板的特征向量;估计待检测图像各像素属于结构模板的隶属度;利用像素的颜色估计近邻像素之间的亲合度;利用近邻像素之间的亲合度,对待检测图像各像素属于结构模板的隶属度进行平滑;利用待检测图像各像素属于结构模板的隶属度,采用排序搜索法从待检测图像中提取出与结构模板相似的重复结构。该方法解决现有技术检测精度低的问题以及现有技术在界定多种不同类型的重复结构时所遇到的不确定性问题,具有广阔的应用前景。
-
公开(公告)号:CN101277429B
公开(公告)日:2011-09-07
申请号:CN200710064819.4
申请日:2007-03-27
Applicant: 中国科学院自动化研究所 , 北京数字奥森科技有限公司
Abstract: 本发明公开了一种监控中多路视频信息融合处理与显示的方法和系统。该方法包括下列步骤:在初始化时,根据各路视频视野和电子地图视野的标定点,确定每一路视频的局部图像坐标系到全局地图坐标系的坐标变换关系;根据其各路视频图像数据的像素信息,实现对运动目标的检测和跟踪以及在此基础上的各种高层信息提取,实现对同一目标在整个监控场景的不同视野中的传递;定时获取运动目标位置和其他信息,将其从局部图像坐标系变换到全局电子地图坐标系中,并融合到全局电子地图中的二维平面图中将目标显示出来。其使得人们可以更直观的了解到整个监控区域的全局状况。
-
公开(公告)号:CN114898380B
公开(公告)日:2025-02-11
申请号:CN202210474857.1
申请日:2022-04-29
Applicant: 中国科学院自动化研究所
IPC: G06V30/22 , G06V30/19 , G06T3/02 , G06N3/08 , G06N3/0464 , G06V10/82 , G06N3/045 , G06N3/0475 , G06N3/094
Abstract: 本发明提供一种手写文本图像生成方法、装置、设备和存储介质,包括:获取待生成手写文本图像的文本数据;获取所述待生成手写文本图像的风格数据;将所述文本数据和所述风格数据输入预置的手写文本图像模型,得到手写文本图像;其中,所述手写文本图像模型根据干扰标签、训练图像及其对应的文本标签训练得到。本发明的技术方案可以提高合成的手写文本图像的质量。
-
公开(公告)号:CN118334329B
公开(公告)日:2025-02-07
申请号:CN202410248502.X
申请日:2024-03-05
Applicant: 中国科学院自动化研究所
IPC: G06V10/26 , G06V10/143 , G06V10/42 , G06V10/44 , G06V10/82 , G06V10/771 , G06N3/045 , G06N3/0464 , G06N3/0455 , G06N3/096 , G06N3/084
Abstract: 本发明涉及图像处理技术领域,提供一种红外图像分割模型训练方法及红外图像分割方法,该训练方法引入将高频图像块作为输入,且与初始红外图像分割模型结构相同、参数共享的辅助分割模型,用以辅助训练初始红外图像分割模型,可以提升目标红外图像分割模型对红外图像中高频信息的捕捉能力,进而提升目标红外图像分割模型对红外图像的分割效果及分割精度。
-
公开(公告)号:CN118279590A
公开(公告)日:2024-07-02
申请号:CN202410450421.8
申请日:2024-04-15
Applicant: 中国科学院自动化研究所
IPC: G06V10/26 , G06V10/774 , G06V10/82 , G06V20/70 , G06V10/28 , G06N3/0455 , G06N3/084 , G06N3/0895
Abstract: 本发明提供一种半监督的红外图像分割方法,包括:搭建图像分割子网络,该图像分割子网络以红外图像作为输入,提取特征,并将特征变换为像素级的类别预测;搭建辅助分割子网络,该辅助分割子网络直接使用预训练的SAM构建,以无标注的红外图像以及提示信息作为输入,预测伪标签;训练红外图像分割网络,在少量的有标注数据以及较多的无标注数据上定义整体优化目标,并通过梯度下降算法优化红外图像分割网络参数;所述红外图像分割网络包括步骤1的图像分割子网络和步骤2的辅助分割子网络;评估红外图像分割网络效果,在测试集上对每一张红外图像进行推理,并根据真实标注信息计算分割精度。本发明提供能够节约数据标注的成本。
-
公开(公告)号:CN110210574B
公开(公告)日:2022-02-18
申请号:CN201910510470.5
申请日:2019-06-13
Applicant: 中国科学院自动化研究所
IPC: G06V20/10 , G06V10/774 , G06V10/762 , G06V10/764 , G06V10/82 , G06V10/80 , G06K9/62
Abstract: 本发明涉及图像处理领域,具体涉及一种合成孔径雷达图像解译方法、目标识别装置及设备,旨在解决合成孔径雷达图像解译性能不高的问题,本发明方法包括利用合成孔径雷达训练图像和光学训练图像来获取合成孔径雷达图像的解译模型;以及基于所述解译模型进行图像解译或目标识别。本发明提高了SAR图像解译性能。
-
公开(公告)号:CN109785396B
公开(公告)日:2021-09-28
申请号:CN201910064158.8
申请日:2019-01-23
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于计算机视觉技术领域,具体涉及了一种基于双目相机的写字姿态监测方法、系统、装置,旨在解决传统方法只能单一监测眼睛和课桌的距离,无法在不影响书写体验的前提下监测其他错误写字姿态的问题。本发明方法包括:获取双目相机采集的坐姿图像对;采用姿态估计网络进行二维姿态估计,获得二维骨架点位置;依据坐姿图像对,采用双目重建技术进行坐姿三维表面重建,并结合所述二维骨架点位置获得三维骨架点位置;基于预设的骨架点状态‑姿态类别对应关系,获得坐姿图像对所属姿态类别。本发明方法可以详细分析使用者的多种写字姿态,并且不影响使用者的书写体验。
-
公开(公告)号:CN112434674A
公开(公告)日:2021-03-02
申请号:CN202110098072.4
申请日:2021-01-25
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于视觉检测和图像处理领域,具体涉及了一种基于标注框虚拟扩增的微小人脸检测方法、系统、装置,旨在解决模型训练中仅有少量的微小人脸特征图区域被定义为正,从而导致模型对于微小人脸的检测精度和准确性较低的问题。本发明包括:使用矩形框标注微小人脸;基于LFFD构建人脸检测模型;以模型针对小尺度人脸检测分支的特征图下采样倍数为依据,进行矩形框的虚拟扩增;分别基于矩形框和虚拟扩增框生成模型的分类和预测目标;通过反向传播和随机梯度下降法迭代进行模型训练;通过训练后的同时检测通常大小人脸和微小人脸的模型进行在线人脸检测。本发明将标注框虚拟扩增应用于微小人脸数据,提升微小人脸的检出率,实现了微小人脸检测。
-
公开(公告)号:CN112017436A
公开(公告)日:2020-12-01
申请号:CN202010940567.2
申请日:2020-09-09
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及一种城市市内交通旅行时间的预测方法及系统,所述预测方法包括将待测城市划分为矩形网格;基于矩形网格,根据历史交通流量数据构建归一化浮点交通流量矩阵;根据归一化浮点交通流量矩阵,训练城市市内交通流量预测网络;根据矩形网格对车辆行驶路径的轨迹点序列进行简化处理,得到车辆行驶路径的网格化轨迹;根据归一化浮点交通流量矩阵及网格化轨迹,确定网格化轨迹中各轨迹点的特征向量;根据各轨迹点的特征向量,训练城市市内交通旅行时间预测网络;基于城市市内交通流量预测网络和城市市内旅行时间预测网络,根据待测车辆的待测行驶路径,可准确确定所述待测车辆行驶完所述待测路径所需要的旅行时间,可提高复杂场景下预测精度。
-
-
-
-
-
-
-
-
-