-
公开(公告)号:CN119444961A
公开(公告)日:2025-02-14
申请号:CN202411455689.7
申请日:2024-10-17
Applicant: 中国科学院自动化研究所
Abstract: 公开了一种三维场景的纹理生成方法及装置、可读存储介质、计算机程序产品,所述方法包括:获取包含多个实例的三维场景的场景网格和提示文本;对场景网格进行实例分割,获取每个实例的三维定向包围盒;基于每个实例的三维定向包围盒,获取每个实例在预定数量的视角中每个视角的二维实例布局和二维方位提示图;针对预定数量的视角中任一视角,执行如下处理:将提示文本、当前视角的二维实例布局和二维方位提示图、以及已获取的目标图像输入到扩散模型,得到三维场景在当前视角的目标图像;基于所有目标图像,生成包含纹理信息的三维场景。
-
公开(公告)号:CN119399751A
公开(公告)日:2025-02-07
申请号:CN202411412775.X
申请日:2024-10-11
Applicant: 中国科学院自动化研究所
IPC: G06V20/64 , G06V10/26 , G06V10/52 , G06V10/764 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/09
Abstract: 本发明公开了一种基于特征区分学习深度网络的遮挡立面感知方法和系统,所述方法包括步骤1:获取遮挡立面图像集合;步骤2:将遮挡立面图像集合输入深度网络,得到第一阶段增强后的图像深层表示;步骤3:将第一阶段增强后的图像深层表示分别送入两个辅助处理模块进行处理,获得两个具有区分性隐层特征的多尺度增强表征;步骤4:获得关注规则组件与关注背景的差分二分类语义预测图,获得所有类别语义预测图;步骤5:基于二分类语义预测图和所有类别语义预测图训练深度网络并保存训练好的深度网络。本发明解决了如何有效处理遮挡和解析立面图像的技术问题,在计算机视觉、图形领域以及立面图像处理等领域有很好的应用价值。
-
公开(公告)号:CN113936128B
公开(公告)日:2024-11-15
申请号:CN202111057748.1
申请日:2021-09-09
Applicant: 中国科学院自动化研究所 , 东华大学
IPC: G06V30/19 , G06V30/18 , G06V30/16 , G06V10/82 , G06N3/0464
Abstract: 本发明提供一种文本检测方法、装置、电子设备及存储介质,该方法包括:通过特征金字塔将原始光照图像转化为对应的参数矩阵,基于参数矩阵调整原始光照图像的图像亮度,得到原始光照图像对应的待处理暗光图像;基于特征提取网络对原始光照图像对应的原始暗光图像,及待处理暗光图像分别进行多层特征提取,分别得到原始暗光图像对应的原始特征和补充特征;基于补充特征对原始特征进行特征补全,得到特征补全的原始暗光图像;基于输出网络输出特征补全的原始暗光图像的热力图和文本预测框,基于热力图和文本预测框进行文本检测。本发明通过合成暗光图像及原始暗光图像的特征补全,直接检测暗光环境下的文本,提升了暗光环境下文本检测的准确性。
-
公开(公告)号:CN118521618A
公开(公告)日:2024-08-20
申请号:CN202410630555.8
申请日:2024-05-21
Applicant: 中国科学院自动化研究所
IPC: G06T7/33 , G06V10/762
Abstract: 本申请实施例提供一种非刚性点集配准方法、装置及存储介质,所述方法包括:获取目标初始状态的源点集;基于非刚性点集配准损失函数,将所述源点集作为聚类中心,将目标点集作为聚类样本,进行无监督聚类获取目标点集,所述目标点集用于表示非刚性变形后的目标的点集结果,所述非刚性点集配准损失函数是基于#imgabs0#低秩近似方法确定的。本申请实施例提供的非刚性点集配准方法、装置及存储介质,通过获取目标初始状态的源点集,并根据非刚性点集配准损失函数,将所述源点集作为聚类中心,将目标点集作为聚类样本,进行无监督聚类,可以获取用于表示非刚性变形后的目标点集,从而能够在在不影响优化轨迹的情况下,提高非刚性点集配准的准确率。
-
公开(公告)号:CN116821988A
公开(公告)日:2023-09-29
申请号:CN202310747570.6
申请日:2023-06-21
Applicant: 中国科学院自动化研究所 , 中国科学院数学与系统科学研究院
Abstract: 本发明提供一种基于几何基元装配的点云结构化建模方法、装置及设备,其中方法包括:获取点云数据,并对点云数据进行二次基元检测,得到初始几何基元分布;对初始几何基元分布进行优化,得到目标几何基元分布,并确定目标几何基元分布对应的几何基元的参数;基于几何基元的参数,生成几何基元对应的多个代理网格,并对多个代理网格两两求交,得到多个候选曲面块;对多个候选曲面块进行筛选,得到活动候选曲面块;基于活动候选曲面块,装配得到目标表面网格。本发明提供的方法、装置、及设备,采用了多种二次基元而非单一平面基元,减少了近似物体所需的几何基元数量;并对多个候选曲面块进行筛选,从而提高了装配得到目标表面网格的效率。
-
公开(公告)号:CN111222564B
公开(公告)日:2023-05-23
申请号:CN202010003281.1
申请日:2020-01-02
Applicant: 中国科学院自动化研究所
IPC: G06V10/764 , G06V10/80 , G06V10/82 , G06N3/0464
Abstract: 本发明属于数字图像技术领域,具体涉及一种基于图像通道相关性的图像鉴别系统、方法、装置,本发明系统包括多个混合特征提取模块,用于获取待鉴别图像的混合有通道和邻域相关性的特征的融合特征;特征融合模块,将多个所述混合特征提取模块输出的融合特征叠加为一个总特征映射,并通过多个卷积将所述总特征映射融合为一个高维度的特征表示;图像分类模块,基于所述高维度的特征表示分别获取自然图像、渲染图像的分类概率,并将分类概率大的作为鉴别结果输出。本发明提提升了卷积网络对渲染图像的识别准确率和效率。
-
公开(公告)号:CN115204301A
公开(公告)日:2022-10-18
申请号:CN202210868349.1
申请日:2022-07-22
Applicant: 腾讯科技(深圳)有限公司 , 中国科学院自动化研究所
Abstract: 本申请涉及一种视频文本匹配模型训练、视频文本匹配方法、装置、计算机设备、存储介质和计算机程序产品。本申请涉及人工智能技术。所述方法包括:将训练样本对集合中训练视频对应的视频特征、参考特征和训练文本对应的训练文本特征输入初始视频文本匹配模型;参考特征包括音频特征和动作特征中的至少一种;基于同一训练视频对应的参考特征对相应的视频特征进行特征增强,得到训练视频对应的参考增强视频特征;将训练文本对应的训练文本特征,分别和训练视频对应的视频特征、参考增强视频特征进行相似度计算;基于各个训练样本对所对应的相似度集合训练初始视频文本匹配模型,得到目标视频文本匹配模型。采用本方法能够提高模型预测准确性。
-
公开(公告)号:CN115170410A
公开(公告)日:2022-10-11
申请号:CN202210693209.5
申请日:2022-06-17
Applicant: 中国科学院自动化研究所 , 吉林大学
Abstract: 本发明提供一种融合小波变换和注意力机制的图像增强方法及装置,该方法包括:将目标图像输入增强模型中的特征提取分支模型,得到目标图像的多个不同尺度的第一特征图;将目标图像输入增强模型中图像增强分支模型的第一下采样模块,得到目标图像的第二特征图;将第二特征图和第一特征图输入图像增强分支模型的第一上采样模块,得到目标图像的第三特征图;第一上采样模块和第一下采样模块均融合小波变换和注意力机制;将目标图像的第三特征图输入图像增强分支模型的第三输出层,得到目标图像的增强图像。本发明实现在图像增强过程中融合小波变换和注意力机制,以实现在自适应增强目标图像的同时抑制噪声,进而提高增强图像的质量。
-
公开(公告)号:CN114155419A
公开(公告)日:2022-03-08
申请号:CN202111266606.6
申请日:2021-10-28
Applicant: 中国科学院自动化研究所 , 大连理工大学
Abstract: 本发明公开了暗光图像物体检测硬件实现的方法、系统及电子设备,方法包括:获取输入图像数据、N个增强权重集合以及M个识别权重集合;根据N个增强权重集合依次对第一像素数据计算,得到第二像素数据;根据M个识别权重集合依次对第二像素数据计算,得到第三像素数据;根据第三像素数据确定暗光图像物体检测结果。本发明通过将暗光图像物体检测硬件实现降低了算法部署系统的功耗,并且相比于传统计算机系统计算效率得到了提升,提高了使用范围。将暗光增强算法和目标识别算法相结合,提高了对暗光图像物体检测识别率和算法计算效率。
-
公开(公告)号:CN106652036B
公开(公告)日:2020-10-20
申请号:CN201611073459.X
申请日:2016-11-29
Applicant: 中国科学院自动化研究所
IPC: G06T17/20
Abstract: 本发明涉及一种面向高效渲染的二维三角网格生成方法,所述方法包括:根据给定渲染对象的边界形状,生成初始的二维三角网格;在二维三角网格中寻找所有的簇,其中,每个簇为包括一个钝角三角形和与该钝角三角形邻近的两个或更多三角形的整体,并且簇与簇之间不重合;在每个簇内插入Steiner点,以生成新的二维三角网格。本发明可以保证生成全锐角的二维三角网格,并且可以优化较小的角度,从而能够保持良好的二维三角网格形状结构以进行二维对象的高效渲染。
-
-
-
-
-
-
-
-
-