-
公开(公告)号:CN101751689A
公开(公告)日:2010-06-23
申请号:CN200910093767.2
申请日:2009-09-28
Applicant: 中国科学院自动化研究所 , 北京盛开互动科技有限公司
Abstract: 本发明为一种三维人脸重建方法,从单张正面人脸图像自动重建三维人脸模型,提出两种方案,第一种:离线生成人脸形变模型;利用Adaboost自动检测输入图像中的人脸位置;利用主动外观模型在输入图像中自动定位人脸上的关键点;基于人脸形变模型的形状分量和图像上的人脸关键点重建三维人脸的几何形状;以形状无关纹理作为目标图像,利用人脸形变模型的纹理分量进行人脸纹理拟合,得到完整的人脸纹理;纹理映射后得到重建结果。第二种与第一种不同之处在于:在重建三维人脸的几何形状之后,不进行人脸纹理拟合,而是直接以输入图像作为纹理图像,得到重建结果。本发明的方案一适合应用在影视制作、三维人脸识别等领域,方案二重建速度快。
-
公开(公告)号:CN118417837A
公开(公告)日:2024-08-02
申请号:CN202410281943.X
申请日:2024-03-12
Applicant: 北京航空航天大学 , 中国科学院自动化研究所
IPC: B23P19/00
Abstract: 本发明公开一种基于2D表面触觉孪生网络的软排线装配定位方法,用于手机软排线的装配,用触觉传感器在理想扣合位置进行按压来得到触觉点阵的数据,将此触觉数据信息作为标准数据信息,并记录下理想扣合位置周围的触觉点阵数据;将正确的触觉数据信息和错误的触觉数据信息都转换成图像,并且将软排线位置计算视为正确触觉图像和错误触觉图像之间的图像配准问题;同时提出了一种深度孪生神经网络,此网络对触觉图像进行特征提取后利用回归网络来计算软排线的理想扣合位置;此方法可以在手机软排线的装配任务中提高装配效率和扣合成功率。本发明也可以用于视觉被遮挡时的装配应用中。本发明也可以应用于机器人精密装配的其他领域。
-
公开(公告)号:CN113269803B
公开(公告)日:2023-01-13
申请号:CN202110644112.0
申请日:2021-06-09
Applicant: 中国科学院自动化研究所(CN)
Abstract: 本发明属于地图创建与扫描定位领域,具体涉及了一种基于2D激光与深度图像融合的扫描定位方法、系统及设备,旨在解决现有扫描定位结果无法实时显示,效率、准确性及精度低的问题。本发明包括:创建网格地图,使用2D激光雷达数据在网格地图中逐帧创建2D地图轮廓;把RGB‑D相机图像数据压缩为一维特征向量,并与2D激光雷达数据特征向量融合为表示当前角度和位置的图像特征的一维向量;将地图多次采样构建为金字塔结构,把当前视图的RGB‑D相机和2D激光雷达获得的信息转化为一维特征向量,采用由粗到精的策略将转化后的一维向量与地图中保存的一维特征向量对比,确定准确位置。本发明扫描定位效率高,准确性和精度高,并可实时显示定位结果。
-
公开(公告)号:CN115471525A
公开(公告)日:2022-12-13
申请号:CN202211026267.9
申请日:2022-08-25
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于目标跟踪技术领域,具体涉及了一种基于融合孪生网络与卡尔曼滤波的目标跟踪方法及系统,旨在解决现有技术仅采用卡尔曼滤波技术在复杂场景下的跟踪任务,跟踪正确率及目标形变适应性低的问题。本发明包括:给定初始帧中目标的位置和大小;以目标模板和搜索区域作为图像对进行特征提取,并确定搜索区域;候选区域生成网络生成多尺度候选框、特征得分图和回归参数响应图;在搜索区域中进行边缘惩罚;边缘惩罚后若存在置信度大于阈值的候选框,则作为预测结果输出;反之,修正目标运动状态和预测目标位置;更新目标运动信息和位置信息。本发明以有效降低在跟踪过程中出现错误更新目标运动信息和位置信息的概率,提升复杂背景下跟踪成功率。
-
公开(公告)号:CN115082299B
公开(公告)日:2022-11-25
申请号:CN202210857769.X
申请日:2022-07-21
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于图像转换技术领域,具体涉及了一种非严格对齐的小样本不同源图像转换方法、系统及设备,旨在解决现有深度学习的模型训练样本图像少、获取困难,导致训练好的模型性能较低的问题。本发明包括:构建图像转换模型,其生成器基于编码器、转换器和解码器构建,判别器基于卷积神经网络和激活函数构建;获取X类别和Y类别图像对,并进行图像增强;通过增强后的图像对进行图像转换模型的训练;通过训练好的图像转换模型,将获取的一个或少量X类别图像转换为Y类别图像。本发明通过非严格对齐方法构建容易获得的图像类别向不容易获得的图像的转换,有效提升不容易获得的图像的目标特征学习效果。
-
公开(公告)号:CN112541936B
公开(公告)日:2022-11-08
申请号:CN202011448839.3
申请日:2020-12-09
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及一种执行机构操作空间视觉信息确定方法及系统,所述视觉信息确定方法包括:获取关于执行机构操作空间的多个样本;其中,每一样本均包括光学图像、深度图像及三维坐标;根据各样本,建立视觉信息映射模型;具体包括:针对每一样本,根据目标物的光学图像、深度图像,确定目标像素位置信息;根据目标像素位置信息,确定二值掩码图像;基于各目标物的光学图像、深度图像、二值掩码图像及三维坐标,确定视觉信息映射模型;获取待测目标物的待测光学图像、待测深度图像;基于视觉信息映射模型,根据所述待测光学图像、待测深度图像,可快速确定所述待测目标物的三维坐标信息。
-
公开(公告)号:CN112541431A
公开(公告)日:2021-03-23
申请号:CN202011455217.3
申请日:2020-12-10
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及一种高分辨率图像目标检测方法及系统,所述检测方法包括:根据待检高分辨率图像的尺寸,确定分块基准比例大小;根据所述待检高分辨率图像的尺寸、分块基准比例大小,以及待检目标的最大尺寸,对待检高分辨率图像进行分块,得到多个基准块图像;针对每一基准块图像,通过检测设备检测基准块图像中的目标,确定检测时间;根据各检测时间及各基准块图像,确定分块效率函数;根据分块效率函数,确定最优分块比例;根据最优分块比例,对所述待检高分辨率图像进行二次分块,得到多个子图像;通过检测设备检测,可快速、准确的确定各子图像中目标,使得检测设备的硬件资源的利用率最高。
-
公开(公告)号:CN103700130B
公开(公告)日:2017-01-25
申请号:CN201310746136.2
申请日:2013-12-30
Applicant: 中国科学院自动化研究所
IPC: G06T13/80
Abstract: 本发明提供了一种发音器官动画生成方法,包括:发音器官运动关键点的定义,各发音器官的中矢状面的二维网格的生成,发音器官纹理贴图,基于薄板样条的网格运动计算。本发明由发音器官运动关键点的位置,推算出发音器官中矢状面的形状,进而可以由发音器官运动关键点的运动,直接得到整个发音器官在中矢状面的运动情况,其优势在于简化的发音器官运动的描述参数,降低了发音器官动画制作的难度。
-
公开(公告)号:CN103577828A
公开(公告)日:2014-02-12
申请号:CN201310597554.X
申请日:2013-11-22
Applicant: 中国科学院自动化研究所
IPC: G06K9/46
Abstract: 本发明公开了一种基于边缘特征分析的自动道路检测方法,该方法包括:对于目标图像,采用边缘梯度算子计算得到多幅梯度图像,对其进行二值化处理,得到多幅初步道路边缘图像;基于自动获取的阈值将多幅初步道路边缘图像中像素个数小于该阈值的连通区域去除,获得多个方向上的道路边缘图像;将多个方向的道路边缘图像中的道路边缘信息整合到同一幅图像中,并根据道路两侧具有相似边缘的原理夹逼出道路像素区域,得到初步道路图像;采用基于线段拟合的生长算法进行道路区域间的连接,并根据道路区域的长宽比去除一些非道路区域,最终获得检测得到的道路。本发明适用于航拍图像的自动道路检测,具有检测精度高、实时性好、抗干扰性强等优点。
-
公开(公告)号:CN119245527B
公开(公告)日:2025-02-25
申请号:CN202411775189.1
申请日:2024-12-05
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供了一种甘蔗生长高度的测量方法及系统,可以应用于农业测量领域与人工智能领域。该测量方法包括:将利用单个深度相机拍摄目标甘蔗所得到的多个图像输入目标检测模型,得到目标甘蔗的甘蔗底部图像和甘蔗顶梢图像,目标检测模型是基于针对甘蔗特征所改进的深度学习模型,深度相机搭载在云台上,云台用于控制深度相机的拍摄角度;根据甘蔗顶梢图像和甘蔗底部图像,从深度相机中获取深度相机到甘蔗顶梢的第一距离以及深度相机到甘蔗底部的第二距离;获取深度相机的目标角度,目标角度是根据拍摄甘蔗顶梢图像的第一拍摄角度和拍摄甘蔗底部图像的第二拍摄角度确定的;根据第一距离、第二距离和目标角度,得到目标甘蔗的目标生长高度。
-
-
-
-
-
-
-
-
-