一种基于因果解耦生成模型的域泛化图像识别方法

    公开(公告)号:CN114863213B

    公开(公告)日:2024-04-16

    申请号:CN202210512236.8

    申请日:2022-05-11

    Abstract: 本发明公开一种基于因果解耦生成模型的域泛化图像识别方法。域泛化的目的是从多个源域数据中学习域不变表示很好的泛化到不可见的目标域,但是学习域不变特征的最大挑战在于从纠缠的特征空间中分解出语义信息和域信息。考虑到因果特征具有跨域不变的特性,本发明提出了因果解耦表征模型。首先,将跨域稳定的因果结构模型作为先验引入。然后,构建基于因果结构的生成模型,分别为任务相关和域相关特征建模。特别的是,两个隐特征之间的双向因果依赖通过一种干预手段解除,从而有效消除域相关特征对预测任务的影响。结果证明,本发明提出的方法能够有效解耦出任务相关和域相关特征,超过了大多数的解决域泛化的方法。

    基于自适应任务权重的多任务网络模型训练方法及系统

    公开(公告)号:CN114819091B

    公开(公告)日:2024-04-16

    申请号:CN202210492786.8

    申请日:2022-05-07

    Inventor: 张传刚 杨冰 那巍

    Abstract: 本发明涉及基于自适应任务权重的多任务网络模型训练方法及系统。本发明通过一个特定于任务的策略学习共享模式,该策略自主选择在多任务网络中执行哪些层,并且能够同时搜索与任务较匹配的权重,以更好地训练模型。本发明基于ResNet重构了多任务网络模型,训练过程中根据数据集中的图像有效地优化了学习策略,提高了任务指标的同时克服了多任务模型的单一性。本发明基于概率论极大似然估计推导了适用于回归和分类任务的多任务损失函数,其能够在训练过程中自动调节任务权重以更好地提升模型性能,克服了任务权重不灵活的问题。

    一种基于因果解耦生成模型的域泛化图像识别方法

    公开(公告)号:CN114863213A

    公开(公告)日:2022-08-05

    申请号:CN202210512236.8

    申请日:2022-05-11

    Abstract: 本发明公开一种基于因果解耦生成模型的域泛化图像识别方法。域泛化的目的是从多个源域数据中学习域不变表示很好的泛化到不可见的目标域,但是学习域不变特征的最大挑战在于从纠缠的特征空间中分解出语义信息和域信息。考虑到因果特征具有跨域不变的特性,本发明提出了因果解耦表征模型。首先,将跨域稳定的因果结构模型作为先验引入。然后,构建基于因果结构的生成模型,分别为任务相关和域相关特征建模。特别的是,两个隐特征之间的双向因果依赖通过一种干预手段解除,从而有效消除域相关特征对预测任务的影响。结果证明,本发明提出的方法能够有效解耦出任务相关和域相关特征,超过了大多数的解决域泛化的方法。

    基于单目彩色图像的三维手部姿态估计方法及其系统

    公开(公告)号:CN117576320A

    公开(公告)日:2024-02-20

    申请号:CN202311636632.2

    申请日:2023-12-01

    Abstract: 本发明公开一种基于单目彩色图像的三维手部姿态估计方法及其系统。本发明构建三维手部姿态估计模型,通过引入交错更新多尺度图像特征特征的编码器,使编码器的设计不再受限于序列长度,同时融合了多尺度语义信息,帮助生成手部姿态。本发明引入可变形注意力,使得注意力机制仅会对参考点周围的一组固定数量的关键点进行计算,在保证计算效率的同时,提高解码器的表达能力。加入图卷积增强模块,捕获网格顶点间的显式的语义联系,强化特征的空间局部性。本发明在FreiHAND数据集和HO3DV2数据集上进行了训练及评估,相较于以往方法,本发明有较好的效果。

    一种视觉词汇的上下文描述子生成方法

    公开(公告)号:CN105678349A

    公开(公告)日:2016-06-15

    申请号:CN201610005159.1

    申请日:2016-01-04

    CPC classification number: G06K9/723

    Abstract: 本发明涉及一种视觉词汇的上下文描述子生成方法。本发明包括离线学习、上下文描述子生成和上下文描述子相似性计算。离线学习用于视觉词汇词典的构建和视觉词汇的评价。上下文描述子生成步骤如下:1.局部特征点的提取和特征描述子的量化;2.上下文的选择;3.上下文中局部特征点的特征提取和上下文描述子的生成。上下文描述子相似性计算依据上下文描述子中局部特征点的方位、主方向和视觉词汇一致性来验证两个上下文描述子中的局部特征点是否匹配,并通过匹配的视觉词汇的反文档频率的和来评价两个上下文描述子的相似性。本发明构建的上下文描述子能够适应图像裁剪、旋转、尺度缩放等变换带来的影响,可用于基于视觉词汇的图像检索和分类等应用中。

    基于LIP-TCN-LSTM的城市积涝水位短期预测方法及系统

    公开(公告)号:CN115545296A

    公开(公告)日:2022-12-30

    申请号:CN202211200467.1

    申请日:2022-09-29

    Abstract: 本发明公开了一种基于LIP‑TCN‑LSTM的城市积涝水位短期预测方法及系统。本发明方法主要包含三个部分:积涝数据的获取与预处理,TCN‑LSTM神经网络模型的构建与训练,以及实时预测。基于MAE,RMSE和R2三个评价指标和两个数据集,将本发明TCN‑LSTM模型与其他七种模型(TCN、LSTM、GRU CNN、BP、CNN+LSTM、RNN)进行横向对比,然后使用TCN‑LSTM进行预测和可视化分析,证明本发明所提的方法在不同评价指标下均有着很好的表现和较高的精确度。

    一种视觉词汇的上下文描述子生成方法

    公开(公告)号:CN105678349B

    公开(公告)日:2018-12-07

    申请号:CN201610005159.1

    申请日:2016-01-04

    Abstract: 本发明涉及一种视觉词汇的上下文描述子生成方法。本发明包括离线学习、上下文描述子生成和上下文描述子相似性计算。离线学习用于视觉词汇词典的构建和视觉词汇的评价。上下文描述子生成步骤如下:1.局部特征点的提取和特征描述子的量化;2.上下文的选择;3.上下文中局部特征点的特征提取和上下文描述子的生成。上下文描述子相似性计算依据上下文描述子中局部特征点的方位、主方向和视觉词汇一致性来验证两个上下文描述子中的局部特征点是否匹配,并通过匹配的视觉词汇的反文档频率的和来评价两个上下文描述子的相似性。本发明构建的上下文描述子能够适应图像裁剪、旋转、尺度缩放等变换带来的影响,可用于基于视觉词汇的图像检索和分类等应用中。

    一种彩色误差扩散方法

    公开(公告)号:CN103957343B

    公开(公告)日:2016-08-17

    申请号:CN201410163162.7

    申请日:2014-04-22

    Inventor: 朱文华 杨冰

    Abstract: 本发明涉及一种彩色误差扩散方法。一般数字打印机、印刷机只有非常有限的颜色可以输出。本发明方法首先将彩色图像经过色彩转换后获得再现设备色空间的图像,获得的图像分解为多个色平面的灰度图像;然后选择一种二值灰度误差扩散方法进行处理,并将选择的二值灰度误差扩散方法扩展至多级灰度误差扩散方法;对获得的再现设备色空间中的彩色图像进行量化和误差扩散处理。本发明方法引入嵌入式多级灰度误差扩散方法控制输出重叠点的数量,该方法在输出色空间中进行量化处理,避免了复杂的色彩转换带来的色彩失真,既能够有效控制重叠点的产生,又能满足任意数量色平面颜色空间的输出需求。

    一种基于地理位置信息的场景检索方法

    公开(公告)号:CN104794219A

    公开(公告)日:2015-07-22

    申请号:CN201510208102.7

    申请日:2015-04-28

    Abstract: 本发明公开了一种基于地理位置信息的场景检索方法。本发明包括如下步骤:步骤1、在索引过程中对场景图像的地理信息和全局描述子进行索引,并构建空间4叉树索引结构;全局描述子的构建如下:1-1.提取场景图像的局部特征点,将场景图像表示成局部特征的集合;1-2.根据视觉词汇词典将局部特征点的描述子进行量化,得到对应的视觉词汇;1-3.将提取的视觉词汇集合投影到随机投影矩阵上得到场景图像的全局描述子。步骤2、在查询过程中通过层级验证方式确定相似图像集,并通过投票方式和相似图像的信息来获得待查询的场景图像的信息。本发明高效的过滤掉了大量的非相关图像。提高了视觉词汇空间验证的效率和图像匹配的准确率。

Patent Agency Ranking