-
公开(公告)号:CN115170879B
公开(公告)日:2025-04-18
申请号:CN202210814527.2
申请日:2022-07-12
Applicant: 北京大学
IPC: G06V10/764 , G06V10/82
Abstract: 本发明公布了一种基于深度学习优化器的大规模图像分类方法,通过构建新的深度学习优化器,利用图像训练数据和构建的深度学习优化器训练深度神经网络模型,得到训练好的图像分类深度神经网络模型;再将待分类的包含预定义类别的彩色图像输入到训练好的图像分类深度神经网络模型,模型的输出为图像的类别标签,由此实现大规模图像分类。采用本发明方法进行大规模图像分类,可避免在外推点计算梯度而带来的额外计算和内存的开销,对数据量的批大小具有极大的耐受性,能够提高大规模图像分类的效率及图像分类精度。
-
公开(公告)号:CN114998659B
公开(公告)日:2024-05-24
申请号:CN202210694741.9
申请日:2022-06-17
Applicant: 北京大学 , 人工智能与数字经济广东省实验室(广州)
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06N3/049 , G06N3/084
Abstract: 本发明公布了一种随时间在线训练脉冲神经网络模型的图像数据分类方法,构建脉冲神经网络模型并设计随时间在线方法训练模型;再利用训练好的模型对图像数据进行分类和识别,有效提升图像数据的分类和识别性能;其中图像数据包括计算机图像数据和神经形态的图像视觉数据。通过本发明提供的方法,可以在训练脉冲神经网络SNN模型时,极大地减小训练内存的开销,将训练得到的模型用于计算机图像数据和神经形态图像视觉数据的分类与识别等视觉任务,能够提高分类与识别性能、降低识别系统的处理延迟,能实现高效节能的图像视觉数据分类与识别系统。
-
公开(公告)号:CN117953302A
公开(公告)日:2024-04-30
申请号:CN202410162884.4
申请日:2024-02-05
Applicant: 北京大学
IPC: G06V10/764 , G06V10/82 , G06V30/19 , G06V30/22 , G06N3/0464 , G06N3/09 , G06N3/084 , G06N3/0985
Abstract: 本发明公布了一种基于微分不变量的仿射等变网络模型的图像分类方法,设计基于微分不变量的仿射等变网络并用于图像分类任务,包括:首先基于微分不变量构造仿射等变网络,在不需要对群进行离散化或采样的情况下实现仿射等变性;其次,通过对多项式相对微分不变量进行归一化,构造新的仿射不变量,有效提升模型的数值稳定性;然后,对网络结构进行拓展,得到通道数可变的仿射等变网络模型,同时设计了可以嵌入任意卷积神经网络的等变层,增强模型的灵活性。本发明方法也适用于设计对仿射群的连续子群具有等变性的深度网络模型。利用本发明提供的仿射等变网络模型,可高效实现图像分类,提升图像分类准确率。
-
公开(公告)号:CN117893804A
公开(公告)日:2024-04-16
申请号:CN202410015446.5
申请日:2024-01-05
Applicant: 北京大学
IPC: G06V10/764 , G06V10/82 , G06N3/045 , G06N3/084
Abstract: 本发明公布了一种基于具有万有逼近性质的神经网络架构的图像分类方法,将图像分类任务进行优化建模,采用基于梯度的一阶优化算法进行模型求解;其中的梯度项采用神经网络中的可学习模块T表示,得到图像分类神经网络;训练模型;将待分类的图像输入到训练好的图像分类深度神经网络模型,即可输出图像的类别标签,实现图像分类,图像分类精度更高。采用本发明的技术方案,可高效、节能地设计有性能保障的神经网络架构,并运用于图像分类、信号处理、神经网络学习优化等应用领域。
-
公开(公告)号:CN111967528B
公开(公告)日:2023-12-26
申请号:CN202010876709.3
申请日:2020-08-27
Applicant: 北京大学
IPC: G06V10/82 , G06V10/77 , G06V10/774 , G06N3/0464 , G06N3/084 , G06N3/0985
Abstract: 本发明公布了一种基于稀疏编码的深度学习网络结构搜索的图像识别方法,将基于梯度的可微分网络模型结构进行优化,构造用于在原始高维空间经压缩后映射的低维空间上进行结构搜索的网络模型,再通过稀疏编码技术使得压缩后的低维空间的解对应于原始空间的稀疏解,搜索时优化的网络模型结构即为重训练时的结构,应用于搜索‑重训练两阶段图像识别以及搜索‑重训练合并一阶段图像识别。本发明在搜索阶段的网络即具有稀疏性,在搜索训练阶段最终收敛的结构即为最终搜到的结构,网络结构搜索更加高效合理,使得图像识别的性能优异。
-
公开(公告)号:CN113313161B
公开(公告)日:2023-09-26
申请号:CN202110568102.3
申请日:2021-05-24
Applicant: 北京大学
IPC: G06V10/764 , G06V10/82 , G06V10/766 , G06N3/0464 , G06N3/082
Abstract: 本发明公布了一种基于旋转不变的规范等变网络模型的物体形状识别方法,通过将每个3D物体的全局坐标在局部坐标上进行投影,构建并利用基于旋转不变的规范等变卷积网络模型,实现空间旋转不变的3D物体形状分类与识别。本发明方法可与现有逐点激活函数一起使用,提升了模型识别3D物体形状的性能;同时,本发明利用旋转对称性以及规范对称性作为先验信息,实现了高效的参数共享机制,能在参数量更少的情况下,超越现有最优的网络模型,能够取得更优的3D物体形状分类性能。
-
公开(公告)号:CN111401155B
公开(公告)日:2022-05-20
申请号:CN202010133492.7
申请日:2020-02-28
Applicant: 北京大学
Abstract: 本发明公布了一种基于隐式欧拉跳跃连接的残差神经网络的图像识别方法,将隐式欧拉数值方法与残差网络模型中的跳跃连接相结合,建立具有更强鲁棒性的改进模型:含有隐式欧拉跳跃连接的残差神经网络,该改进模型的输入为图像数据及所对应的标签,输出为图像的预测分类,由此实现更加稳定的图像识别。本发明提出的基于含有隐式欧拉跳跃连接的残差神经网络的图像识别方法,具有更强的鲁棒性和可信性,可提高图像识别的准确性和有效性,可应用在如人脸识别、文字识别等多种图像识别场景。
-
公开(公告)号:CN112257753A
公开(公告)日:2021-01-22
申请号:CN202011012138.5
申请日:2020-09-23
Applicant: 北京大学
Abstract: 本发明公布了一种基于偏微分算子的广义等变卷积网络模型的图像分类方法,利用群表示与偏微分算子构建等变卷积网络模型PDO‑sCNNs,在卷积网络模型的卷积核上施加约束条件,使得卷积网络具有设定的对称性或等变性,用于高效的进行图像分类与识别视觉分析。采用本发明方法,利用微分算子和群表示求解出所有满足条件的等变卷积层,可以将任意一个已有CNN模型中的卷积层求解出的等变卷积,构建得到等变卷积网络模型,再用该模型进行图像分类识别,效果更佳。
-
公开(公告)号:CN109272452B
公开(公告)日:2020-12-22
申请号:CN201811007566.1
申请日:2018-08-30
Applicant: 北京大学
IPC: G06T3/40
Abstract: 本发明公布了一种小波域中基于集团结构子带共同学习超分辨率网络的方法,通过构建包括特征提取网络和图像恢复网络的新型超分辨率网络,实现单张图片的超分辨率恢复。通过特征提取网络将输入的低分辨率图像表示为一组特征映射;图像复原网络包括一个集团上采样模块和一个卷积层;将特征提取网络的输出特征传入集团上采样模块中,进行子带提取、自残差学习和子带精细化;使用逆离散小波变换改变特征图的分辨率大小,从而恢复得到高分辨率的特征图;再通过卷积层恢复得到高分辨率图像。本发明方法量化指标好,能够有效实现单张图片的超分辨率恢复。
-
公开(公告)号:CN107516129B
公开(公告)日:2020-06-02
申请号:CN201710645965.X
申请日:2017-08-01
Applicant: 北京大学
Abstract: 本发明公布了一种基于维度自适应调整的Tucker分解的深度网络压缩方法,包括维度自适应调整过程和维度适应的权重张量分解过程,通过适应调整张量各维度的大小,生成一个新的任意阶张量,再通过可学习的核张量和转移矩阵去实现张量分解,由此达到网络优化压缩的目的。相比于现有的低秩压缩方法,本发明在保持网络性能的情况下,网络参数量有更大的压缩倍数,能获得更高的压缩倍数;同时,不需要存储非零元素的指引位置,不需要记录索引,可以更有效的利用存储空间。
-
-
-
-
-
-
-
-
-