片上网络路由器通道资源的贪婪分配方法、装置及路由器

    公开(公告)号:CN106453072A

    公开(公告)日:2017-02-22

    申请号:CN201610460938.0

    申请日:2016-06-22

    CPC classification number: H04L45/00 H04L45/60

    Abstract: 本发明提供了一种片上网络路由器通道资源的贪婪分配方法,适用于片上网络技术领域,所述贪婪分配方法在交叉开关分配阶段为路由器的内部的输入端口与输出端口进行映射之前进行,包括:预处理步骤,当数据包进入所述输入端口的子通道和虚通道中时,将数据包信息进行归类处理得到预处理信息表;执行步骤,根据所述预处理信息表以及所述数据包对应的所述输出端口的大小,选择最大限度多个所述数据包匹配所述子通道和所述输出端口。同时还提供一种片上网络路由器通道资源的贪婪分配装置。借此,本发明利用贪婪算法思想对输入端口和输出端口之间进行通道的匹配,达到趋向于最优的映射,提高通道的利用率。

    一种基于数据流架构的深度可分离卷积融合方法及系统

    公开(公告)号:CN113313251B

    公开(公告)日:2023-05-23

    申请号:CN202110522385.8

    申请日:2021-05-13

    Abstract: 本发明提出一种基于数据流架构的深度可分离卷积融合方法和系统,包括:将输入图像数据、卷积参数从主存DRAM搬运到数据缓存SPM;PE阵列通过从数据缓存SPM中读取该输入图像数据、卷积参数,以执行DW卷积,并将得到的DW卷积结果存储在PE内的寄存器中;PE阵列对寄存器中DW卷积结果进行激活计算得到该输入图像数据的初步结果Act_out,将该初步结果Act_out写回数据缓存SPM后,进一步存回主存;PE阵列通过从数据缓存SPM中读取初步结果Act_out与卷积参数,执行PW卷积得到最终结果Output;将最终结果Output写回数据缓存SPM后,进一步存回主存DRAM。本发明减少了数据的存储与访问带来的开销,使得深度可分离式卷积计算在数据流架构上的计算实现加速。

    一种用于分布式训练计算阶段的自动优化方法

    公开(公告)号:CN114911621A

    公开(公告)日:2022-08-16

    申请号:CN202210553734.7

    申请日:2022-05-20

    Abstract: 本发明提供一种用于分布式训练计算阶段的自动优化方法,所述方法包括在分布式训练的每个回合执行如下步骤:S1、以预设的最小单位负载为粒度,计算当前回合中参与分布式训练的所有节点的计算性能;S2、以计算性能最差的节点计算其对应的最大允许负载数的完成时间为限制时间,分别计算每个节点在限制时间内能够完成计算的最大负载数,以所有节点在限制时间内对应的能够完成计算的最大负载数组成负载分配策略;S3、以步骤S2中负载分配策略,分配下一回合每个计算节点的负载。其中,节点的计算性能是该节点完成预设最小单位负载计算的时间。

    一种片上SRAM阵列存储装置及AI神经网络图像数据存储方法

    公开(公告)号:CN114860169A

    公开(公告)日:2022-08-05

    申请号:CN202210510935.9

    申请日:2022-05-11

    Abstract: 本发明提供一种片上SRAM阵列存储装置,所述装置包括多个并列的bank块,每个bank块包括数量相同的连续的多个SRAM单元,每个SRAM单元包括连续的多行存储空间,不同bank块中的同一位置的SRAM单元组成一个SRAM单元行,其中,各个bank块中的各个SRAM单元按照如下方式进行编址:以第一个SRAM单元行中的第一个SRAM单元为起点进行顺序编址,以使相邻地址分散在不同bank块中;相邻SRAM单元行中,后一个SRAM单元行的第一个SRAM单元在前一个SRAM单元行的最后一个SRAM单元的地址的基础上顺序编址。

    基于深度线索的视频场景检索方法和系统

    公开(公告)号:CN109241342B

    公开(公告)日:2022-04-19

    申请号:CN201810811468.7

    申请日:2018-07-23

    Abstract: 本发明涉及一种基于深度线索的视频场景检索方法和系统,包括:获取样本视频,并将样本视频作为输入视频;将输入视频分割为场景片段,根据场景片段的视频场景信息,提取深度线索,对深度线索构成的空间数据降维,作为空间信息描述子;对输入视频进行帧采样得到关键帧,提取关键帧的特征,作为彩色信息描述子;建立空间信息描述子与彩色信息描述子的索引关系,得到场景描述子;对所有样本视频的场景描述子建立视频场景特征库;获取待检索视频,并作为输入视频,得到待检索视频的空间描述子与彩色信息描述子,并根据待检索视频的空间描述子,检索视频场景特征库,得到初步检索结果,对初步检索结果进行彩色特征筛选得到待检索视频的最终检索结果。

    一种数据传输装置及传输方法

    公开(公告)号:CN111459856B

    公开(公告)日:2022-02-18

    申请号:CN202010200676.0

    申请日:2020-03-20

    Abstract: 本发明提供一种数据传输装置,包括:控制逻辑,其用于根据配置信息产生相应的控制信号以控制其他模块的动作;其中,存储体接口逻辑用于从存储体中读取数据或向存储体写入数据;第一选择逻辑用于选择与正向传输模式对应的数据传输路径或与反向传输模式对应的数据接收路径;数据对齐逻辑用于对传输的数据进行对齐操作;重组模块用于对传输的数据进行重组操作以将存储体中读出的数据块拆分成数据分量的形式并重组成新的数据块后传递给片上存储结构进行处理,或将片上存储结构处理后的数据块拆分成数据分量形式并重组成数据块写入存储体;第二选择逻辑用于选择与正向传输模式对应的数据接收路径或与反向传输模式对应的数据传输路径;数据路由逻辑用于确定数据传输的目的地址。

    一种用于动态分配片上网络带宽的方法及装置

    公开(公告)号:CN113296957A

    公开(公告)日:2021-08-24

    申请号:CN202110676326.6

    申请日:2021-06-18

    Abstract: 本发明实施例提供了一种用于动态分配片上网络带宽的方法及装置,该方法获取用户自定义配置的配置文件;根据配置文件将片上网络带宽划分为多个不同优先级的子带宽以及对片上网络上传输的任务进行优先级划分;为各优先级的子带宽分别维护与之对应的任务队列,将相应优先级的任务预分配到与之相同优先级的任务队列;基于轮询机制在每个时间片查询各个任务队列中的可用时间片以及判断相应任务的实时性需求能否满足,若不能满足,则根据所述可用时间片对任务队列中的任务进行重组以跨优先级利用子带宽,本发明可以在片上网络中充分利用带宽,更好地满足片上网络带宽中复杂的任务传输需求。

Patent Agency Ranking