深度学习网络模型的配置方法、装置及存储介质

    公开(公告)号:CN111914985B

    公开(公告)日:2023-07-04

    申请号:CN201910388839.X

    申请日:2019-05-10

    Inventor: 屠震元 叶挺群

    Abstract: 本申请公开了一种深度学习网络模型的配置方法、装置及计算机存储介质,属于深度学习领域。本申请实施例提供的配置方法首先可以获取当前设备的硬件信息,之后根据当前设备的硬件信息,确定深度学习网络模型包括的多层神经网络的输入配置信息,进而根据该深度学习网络模型包括的多层神经网络的输入配置信息和当前设备的硬件信息来为该深度学习网络分配运算资源。这样,即使设备的硬件条件发生了变化,也可以通过本申请提供的配置方法,根据当前设备的硬件信息来为该深度学习网络模型进行配置,也即,本申请提供的配置方法具备通用性。

    一种图像处理方法和装置
    2.
    发明公开

    公开(公告)号:CN116824342A

    公开(公告)日:2023-09-29

    申请号:CN202210260514.5

    申请日:2022-03-16

    Abstract: 本申请实施例提供了一种图像处理方法和装置,涉及深度学习技术领域,方法包括:当需要对图像进行处理时,调用预设模型库文件;其中,预设模型库文件包括:多个预设图像维度信息各自对应的目标深度学习模型的目标模型文件;目标模型文件包含目标深度学习模型的权重参数;按照目标深度学习模型处理最大的预设图像维度信息的图像所需的内存大小,分配用于对各待处理图像进行处理的目标内存空间;针对每一待处理图像,从预设模型库文件中,确定与该待处理图像相匹配的预设图像维度信息对应的目标模型文件;基于确定出的目标模型文件,以及目标内存空间,对该待处理图像进行处理。如此,能够提高图像处理的效率。

    目标检测方法、装置及存储介质

    公开(公告)号:CN111914831B

    公开(公告)日:2023-06-02

    申请号:CN201910388846.X

    申请日:2019-05-10

    Inventor: 屠震元 徐超

    Abstract: 本申请公开了一种目标检测方法、装置及存储介质,属于深度学习技术领域。本申请实施例可以首先从每个第一特征图的多个proposal框的概率值中确定至少一个概率值,之后,再根据确定的至少一个概率值对应的proposal框的尺寸参数确定相应第一特征图中至少一个proposal框的位置,进而根据确定的至少一个proposal框的位置来确定待检测图像中的检测目标。这样,由于先根据proposal框的概率值对Proposal框的尺寸数据进行了筛选,缩减了数据量,因此,后续根据筛选出来的数据确定对应的proposal框的位置即可,减小了计算量,缩短了运算时间,有利于提高检测的实时性。

    图像处理的方法和装置
    4.
    发明授权

    公开(公告)号:CN110969565B

    公开(公告)日:2023-05-16

    申请号:CN201811142940.9

    申请日:2018-09-28

    Inventor: 屠震元

    Abstract: 本申请公开了一种图像处理的方法和装置,属于计算机技术领域。所述方法包括:确定待处理的第一图像的尺寸,根据所述第一图像的尺寸和线程块的预设的线程分布信息,确定待处理的线程块数目;根据所述预设的线程分布信息,确定GPU的单个SM一次任务能处理的线程块数目;根据所述待处理的线程块数目和所述单个SM一次任务能处理的线程块数目,确定SM总使用效率;根据所述SM总使用效率,确定线程块的待使用的线程分布信息,基于所述待使用的线程分布信息,对所述第一图像执行图像处理。采用本申请,可以充分利用SM的硬件资源,从而提高图像处理的效率。

    一种图像检索方法和装置、图像检索设备

    公开(公告)号:CN114625903A

    公开(公告)日:2022-06-14

    申请号:CN202011460941.5

    申请日:2020-12-11

    Abstract: 本申请公开了一种图像检索方法,该方法包括,在图像检索设备侧,获取至少一待检索图像、以及底库数据中被比较图像的特征向量数据,根据图像检索设备的硬件平台类型,按照所述特征向量数据的各个特征维度、和/或维度划分策略,选择用于计算待检索图像与被比较图像相似度的各个算子,根据所选择的算子,调用所选择算子的算子二进制文件并执行,得到相似度结果,比较相似度结果,从底库数据中获得与待检索图像匹配的被比较图像,作为检索结果。本申请有利于构建出一个具有硬件特性的平台来实现最佳性能的检索加速方法,并且,由于从输入特征维度来进行算子的选择,使得本方法能够支持动态分辨率检索,从而获得不同分辨率下的检索效果。

    一种计算图切分方法、装置、电子设备及存储介质

    公开(公告)号:CN116861952A

    公开(公告)日:2023-10-10

    申请号:CN202210289267.1

    申请日:2022-03-22

    Abstract: 本申请实施例提供了一种计算图切分方法、装置、电子设备及存储介质。获取单向无环图;确定算子的预设优化类别为不参与算子融合的节点,作为第一类节点;针对每一第一类节点,将该第一类节点的父节点中的第二类节点标记为缩点中止节点,将该第一类节点的子节点中的第二类节点标记为缩点起始节点;根据每一关系边连接的两个节点的节点类型,确定该关系边的权重;基于缩点中止节点、缩点起始节点和每一关系边的权重进行缩点处理,得到缩点图;基于缩点图对单向无环图进行切分,得到多个第一子计算图。通过本申请实施例提供的技术方案,使得切分得到的各子计算图间的依赖关系较低,以及切分得到的子计算图的数量较少,从而提高网络模型的处理效率。

    一种数据处理方法及装置

    公开(公告)号:CN113361703B

    公开(公告)日:2023-09-05

    申请号:CN202010151570.6

    申请日:2020-03-06

    Inventor: 屠震元 叶挺群

    Abstract: 本申请实施例提供了一种数据处理方法、装置及电子设备,应用于包括融合层的深度学习网络,每一融合层分别与深度学习框架中的卷积层一一对应,每一卷积层对应的融合层为:通过预设参数融合方式和预设规则融合方式、将待融合层融合至该卷积层得到的网络层;方法包括:每一融合层获得与该融合层连接的上一融合层对待处理数据进行数据处理的结果和待处理数据;根据融合层的参数和融合层对应的数据处理规则,对所获得的结果和待处理数据进行数据处理。采用本申请实施例提供的方案处理数据,可以减少数据处理过程中对内存或显存的访问次数,提高数据处理的速度和效率。

    一种提高图像检索速度的方法和装置、图像检索设备

    公开(公告)号:CN114625902A

    公开(公告)日:2022-06-14

    申请号:CN202011460842.7

    申请日:2020-12-11

    Abstract: 本申请公开了一种提高图像检索速度方法,该方法包括,在基于待检索图像、以及底库数据中被比较图像特征向量计算特征向量之间相似度的第一时间区间,触发对当前相似度结果的排序,并进行至少一下一相似度结果的计算,使得至少一下一相似度结果的计算与所述排序并行执行。本申请可以直接将当前相似度结果传入排序进程而进行排序,减少了反复进行内存读取、写入的操作,大大减少了图像检索过程中的耗时,提升了内存利用率。

    基于卷积神经网络进行图像处理的方法和装置

    公开(公告)号:CN110969217A

    公开(公告)日:2020-04-07

    申请号:CN201811142216.6

    申请日:2018-09-28

    Inventor: 屠震元

    Abstract: 本发明公开了一种基于卷积神经网络进行图像处理的方法和装置,属于卷积神经网络领域。所述方法包括:在预先训练的卷积神经网络模型中,查找至少一个层集合,其中,每个层集合由多个不同的处理层按预设顺序串联组成,且每个层集合的首层为卷积层;对于每个层集合,基于所述层集合中各处理层的算法函数,确定所述层集合的综合函数,将所述层集合中各处理层的算法函数,整体替换为所述综合函数;根据经过替换处理得到的更新的卷积神经网络模型,对待处理的图像数据,进行图像处理。采用本发明,可以提升卷积神经网络模型的处理效率。

    基于卷积神经网络进行图像处理的方法和装置

    公开(公告)号:CN110969217B

    公开(公告)日:2023-11-17

    申请号:CN201811142216.6

    申请日:2018-09-28

    Inventor: 屠震元

    Abstract: 本发明公开了一种基于卷积神经网络进行图像处理的方法和装置,属于卷积神经网络领域。所述方法包括:在预先训练的卷积神经网络模型中,查找至少一个层集合,其中,每个层集合由多个不同的处理层按预设顺序串联组成,且每个层集合的首层为卷积层;对于每个层集合,基于所述层集合中各处理层的算法函数,确定所述层集合的综合函数,将所述层集合中各处理层的算法函数,整体替换为所述综合函数;根据经过替换处理得到的更新的卷积神经网络模型,对待处理的图像数据,进行图像处理。采用本发明,可以提升卷积神经网络模型的处理效率。

Patent Agency Ranking