一种基于row-wise分块的宏指令集架构

    公开(公告)号:CN119201229A

    公开(公告)日:2024-12-27

    申请号:CN202411226579.3

    申请日:2024-09-03

    Abstract: 一种基于row‑wise分块的宏指令集架构,包括:args、regs、load、store、remap和compute六个宏指令,args配置用于操作计算的关键参数,reg配置compute指令所需的宏寄存器,load和store控制芯片外存储器和片上存储之间的数据移动,remap用于将数据从一个宏寄存器重新映射到另一个宏寄存器,而无需进行实际的数据移动,compute宏指令用于启动算子计算,其中,regs和compute用于构造内核函数,其他宏指令用于准备操作数。该宏指令集架构能够在一条指令内执行复杂的操作。这种能力使得程序员可以用更少的指令实现更多功能,从而简化编程和调试过程。

    一种轻量化的多AMR协同感知方法及系统

    公开(公告)号:CN118730079A

    公开(公告)日:2024-10-01

    申请号:CN202410738939.1

    申请日:2024-06-07

    Abstract: 本发明公开了一种轻量化的多AMR协同感知方法及系统,对多个环境中待检测物体的感知信息进行时间同步和过滤,基于待检测物体的历史信息和运动信息对缺失帧的信息进行预测和补偿,得到检测结果;通过计算IoU对得到的检测结果进行匹配,将多个AMR系统对同一个目标的多个单机感知结果加入匹配集合;计算匹配集合中的评估分数和可见度指标;并以此维护在一段时间中每个AMR系统检测结果的可信度,同时对每个AMR系统在一段时间中计算该AMR系统的可信度并更新,通过指标融合对匹配集合进行评估;将感知结果轻量级的mqtt通信协议发送到云端服务器,云端服务器对mqtt消息包解析并融合,实现多AMR协同感知。提高了整个系统的感知能力和任务执行效率。

    基于脉冲神经网络的时序信号分类模型构建方法及系统

    公开(公告)号:CN117591932A

    公开(公告)日:2024-02-23

    申请号:CN202311582958.1

    申请日:2023-11-24

    Abstract: 本发明公开了一种基于脉冲神经网络的时序信号分类模型构建方法及系统,包括以下步骤:搭建网络的整体框架,网络全部由脉冲神经元构成,包括输入模块、液体状态机模块、前馈分类网络模块;设置液体状态机内部的神经元,设置合适的神经元数目,设置并优化液体状态机内部的突触连接,使液体状态机达到临界态;设置前馈分类网络的结构;训练网络,获得时序信号的分类网络。本发明提出的模型利用脉冲神经元的特性进行高效表示和处理时间序列的信息,利用LSM和前馈分类网络进行特征提取和模式识别,实现端到端的自动化时序信号分类,为一种生物可解释性强的模型,可在类脑硬件平台上部署,实现轻量级、低能耗、高速度的计算。

    一种多功能的数据重组网络

    公开(公告)号:CN113795831B

    公开(公告)日:2023-09-12

    申请号:CN202180003140.2

    申请日:2021-01-21

    Abstract: 一种多功能的数据重组网络,包括二元交换单元和递归洗牌网络RSN,其中所述二元交换单元和递归洗牌网络RSN都可以实现数据的双向传输,该数据重组网络通过控制信号在网络中的传输方向完成数据重组。该网络可以作为存储单元和运算单元之间的数据传输通路,在数据传输的同时完成多种数据重组功能,从而对非规则数据进行灵活的数据结构调整,提高非规则计算的数据传输效率和计算效率。

    一种基于环境感知的3D目标检测方法及系统

    公开(公告)号:CN116203576A

    公开(公告)日:2023-06-02

    申请号:CN202310214663.2

    申请日:2023-03-07

    Abstract: 本发明公开了一种基于环境感知的3D目标检测方法及系统,构建基于激光SLAM的静态全局地图,并与得到的点云数据进行配准,确定AGV小车在静态全局地图中的位置信息;将配准好的3D点云信息投影到2D像素空间,保存2D像素坐标和3D点云之间的映射关系,得到相机和激光雷达的融合数据;获取障碍物的类别和2D检测框,并反向搜索融合数据,筛选出包含在2D检测框中的点云信息;建立不同障碍物的仿真模型并转为对应的模板点云,再将模板点云位姿变换后替代真实点云并扩充;将得到的静态全局地图中的目标点云作为单机感知结果上传云端进行感知融合,实现基于环境感知的3D目标检测。本发明不需要真实的3D标签,而是依赖于容易获取的2D目标检测结果进行训练。

    增强神经网络卷积运算数据复用度的高速缓存实现方法

    公开(公告)号:CN115374906A

    公开(公告)日:2022-11-22

    申请号:CN202210924541.8

    申请日:2022-08-02

    Abstract: 本公开揭示了增强神经网络卷积运算数据复用度的高速缓存实现方法,其在存储单元LM和矩阵运算单元MPU之间增加高速缓存LC,MPU每次读取数据时,先将所需数据的地址和读命令输入到LC中,查找是否有需要的数据,如果命中,则从LC中读取该数据;否则,将所需数据的地址和读命令输入到LM中,从LM中读取该数据,并且同时将该数据记录在LC中;其中,所述LM包括存储wt数据的LMWT和存储fm数据LMFM,所述高速缓存LC包括存储wt数据的LCWT和存储fm数据LCFM。由于本公开在LM和MPU之间增加了高速缓存LocalCache,进一步提升了数据的复用度,减少了从LM中读取数据的次数,降低处理器的功耗。

    一种通过算法控制单元进行调度计算的硬件结构

    公开(公告)号:CN115374395A

    公开(公告)日:2022-11-22

    申请号:CN202210924137.0

    申请日:2022-08-02

    Abstract: 本公开揭示了一种通过“Algorithm Zoo”进行调度计算的硬件结构,包括系统寄存器控制单元sys registers,算法控制单元Algorithm Zoo,计算阵列单元PE‑Array,片上存储单元Memory,RISC‑V处理器,双倍速率动态存储器DDR和向量处理单元VPU,其中,所述算法控制单元Algorithm Zoo包括数据传输模块TRANS、卷积运算模块CONV、深度可分离卷积计算控制模块DWCON、反卷积计算控制模块DCONV、池化控制模块Pooling和数据变形模块Reshape。本公开的硬件结构可通过编程灵活支持常见的神经网络计算硬件实现。

    一种卷积运算的硬件自动padding的方法

    公开(公告)号:CN115374394A

    公开(公告)日:2022-11-22

    申请号:CN202210924136.6

    申请日:2022-08-02

    Abstract: 本公开揭示卷积运算的硬件自动padding的方法及其数据存储格式。其中,该数据存储格式在数据存储过程中,会将整个输入数据ifm进行分段,每段数据进行8等分切分,得到8组数据,然后对每组数据进行等位置抽取,等位置数据排为一列,进行顺序存储。如此,这种存储格式具有更好的局部性。相比现有技术中的HWC格式,本公开将此种存储格式命名为HWC88格式。对于所述硬件自动padding的方法,在采用HWC88存储格式的数据左右两侧,通过对原数据进行复制、移位后自动补足padding数据,从而快速进行卷积运算,其中在显式存储padding时,将padding部分视为正常数据,不需要额外计算padding地址。

    一种基于深度学习的特征点检测与描述子生成方法

    公开(公告)号:CN114972937A

    公开(公告)日:2022-08-30

    申请号:CN202210024765.3

    申请日:2022-01-11

    Abstract: 一种基于深度学习的特征点检测与描述子生成方法,包括如下步骤:S100:构建新的卷积神经网络;S200:利用所述新的卷积神经网络预测输入图像的特征点并且生成描述子向量;其中,所述新的卷积神经网络结构由两部分组成,第一部分为编码器,用于输入图像的特征编码;第二部分为3个解码器,第一个解码器生成描述子特征图,第二个解码器生成特征点的独特性特征图,第三个解码器由不同层的神经网络特征拼接作为输入生成准确度特征图。本方法生成的特征点具有更高的定位精度和独特性,有助于提高特征点匹配的性能以及后续任务的精度。

Patent Agency Ranking