一种可动态分配运算逻辑单元的矢量运算装置及方法

    公开(公告)号:CN118276945A

    公开(公告)日:2024-07-02

    申请号:CN202410712525.1

    申请日:2024-06-04

    IPC分类号: G06F9/30 G06F17/16

    摘要: 本发明公开一种可动态分配运算逻辑单元的矢量运算装置及方法,涉及芯片设计领域;利用矢量运算装置进行运算逻辑单元ALU的动态分配,在时钟周期,取指单元在内存中取指指令,译码单元识别所取指令类型和功能,并判断所取指令是否需要调度矢量运算逻辑单元VALU分配运算逻辑单元ALU,是则矢量指令接收单元接收指令,根据指令通过运算资源管理单元动态分配相应的运算逻辑单元ALU给各计算核心,并行执行指令中的矢量运算,本发明使得处理器的多个计算核心可以动态共享矢量逻辑运算单元VALU,从而有效降低芯片面积和功耗。

    一种DMA搬取可信数据的方法
    2.
    发明公开

    公开(公告)号:CN117150543A

    公开(公告)日:2023-12-01

    申请号:CN202310995268.2

    申请日:2023-08-09

    IPC分类号: G06F21/62 G06F21/60 G06F21/53

    摘要: 本发明涉及可信数据搬运技术领域,具体为一种DMA搬取可信数据的方法,包括以下步骤:可信程序发起数据传输申请;安全监视器响应可信程序申请,根据完整系保护森林查询并解析申请数据的完整性保护树;安全监视器根据解析完整性保护树的信息查询可信数据,并通知DMA搬运可信数据;DMA将可信数据及相应的完整性保护树搬运至可信程序内存;有益效果为:本发明提出的DMA搬取可信数据的方法,通过完整性保护树密钥由用户自定义,用于加解密可信数据;完整性保护树的根节点由完整性保护森林保护,完整性保护森林的根节点存储有用于加密完整性保护树的根密钥,解决了直接内存访问读取的数据为密文,设备无法解密解密其中的数据的问题。

    一种数据共享方法、装置、设备及介质

    公开(公告)号:CN118642984B

    公开(公告)日:2024-10-22

    申请号:CN202411110547.7

    申请日:2024-08-14

    IPC分类号: G06F13/16 G06T1/20 G06T1/60

    摘要: 本申请公开了一种数据共享方法、装置、设备及介质,涉及数据处理领域,包括:若通用图形处理器中的任一流式多处理器未从自身的一级高速缓存中查找到请求地址对应的数据,则将请求地址发送至与任一流式多处理器所在的目标簇对应的预测单元;在预测单元预测目标簇中存在请求地址对应的共享数据时,向目标簇中的其他流式多处理器广播请求地址,以便其他流式多处理器基于请求地址从自身的一级高速缓存中查找共享数据,并通过目标簇对应的仲裁单元从查找到共享数据的流式多处理器中确定目标流式多处理器,控制目标流式多处理器将共享数据发送至任一流式多处理器。本申请通过同一个簇中的流式多处理器之间的数据共享,可以提高数据处理性能并降低能耗。

    一种并行计算程序优化方法、装置、设备及存储介质

    公开(公告)号:CN118656082A

    公开(公告)日:2024-09-17

    申请号:CN202411154886.5

    申请日:2024-08-22

    摘要: 本申请公开了一种并行计算程序优化方法、装置、设备及存储介质,涉及高性能计算领域,应用于预设程序优化器,包括:获取与并行计算程序对应的源代码,并通过对源代码进行分析、语义突变生成,以得到可行突变集;基于预设优化算法对所述可行突变集中的各突变子集进行筛选,以得到相应的待测试突变子集;基于待测试突变子集对所述源代码进行代码更新、程序生成,以得到相应的突变程序;基于预设测试规则以及突变程序进行相应的程序测试与评估,并利用得到的测试评估结果得到与并行计算程序对应的目标优化补丁,以完成程序优化操作。能够有效避免现有的编译器优化方法难以人工评估及难移植的缺点,并能够在源码级别实现自动优化,提升并行编程效率。

    用于浮点融合乘加的运算单元及方法

    公开(公告)号:CN118897664A

    公开(公告)日:2024-11-05

    申请号:CN202410933216.7

    申请日:2024-07-12

    IPC分类号: G06F7/487 G06F7/485

    摘要: 本申请涉及芯片设计技术领域,公开一种用于浮点融合乘加的运算单元及方法,输入接口用于接收至少三个输入操作数,输入操作数包括浮点操作数和至少一个整型操作数;整型‑浮点转换器内置于单元内部用于将输入的整型操作数直接转换为符合IEEE 754标准的浮点数,转换过程在融合乘加运算之前完成;融合乘加运算器接收由整型操作数转换而来的浮点操作数,将转换的浮点操作数与输入的浮点型操作数直接执行浮点融合乘加运算,即先对两个操作数进行融合乘加运算;输出接口用于输出融合乘加运算的结果。本申请能够在不增加额外转换步骤的情况下,直接对包含整型操作数的融合乘加运算进行处理,从而显著提高运算效率和速度。

    基于RSIC-V架构的地址转换方法、装置和终端设备

    公开(公告)号:CN118012790A

    公开(公告)日:2024-05-10

    申请号:CN202410229495.9

    申请日:2024-02-29

    摘要: 本申请涉及芯片设计领域,具体涉及一种基于RSIC‑V架构的地址转换方法、装置和终端设备,包括:获取被Lx+1级cache拒绝的Lx+1级cache请求;根据预设规则和cache拒绝请求原因,计算请求的优先级;根据优先级,对被拒绝的Lx+1级cache请求排序;将排序靠前的Lx+1级cache请求传递给Lx+1级cache。该方法通过将被拒绝的Lx+1级cache请求传递给仲裁器,经由仲裁器计算请求优先级后,根据优先级对被拒绝的请求序列进行排序,并将最有可能完成的请求传递给Lx+1级cache,以提高请求的命中率,进而提升计算效率。能够提高请求的命中率,进而提升计算效率。

    一种基于分布式通用寄存器的SoC系统设计

    公开(公告)号:CN117591468A

    公开(公告)日:2024-02-23

    申请号:CN202311491345.7

    申请日:2023-11-10

    IPC分类号: G06F15/78

    摘要: 本发明公开了一种基于分布式通用寄存器的SoC系统设计,利用分布式通用寄存器优化数据传输。该系统由一个RISC‑V微处理器和多个外设控制器组成,每个控制器都有其自己的寄存器组。这些寄存器通过直接数据通路与处理器相连,允许无需经过APB总线即可访问,从而显著减少了数据传输延迟。微处理器支持自定义指令,加强了寄存器操作的效率。此外,系统的外设控制器支持UART、SPI和I2C接口,可以与各种传感器和通信模块快速交换数据。本发明的SoC设计降低了能耗,提升了数据处理效率,简化了系统架构,适用于高性能和能效敏感型电子设备。

    一种视频动作识别方法、装置、设备及存储介质

    公开(公告)号:CN117152585A

    公开(公告)日:2023-12-01

    申请号:CN202311119400.X

    申请日:2023-08-31

    摘要: 本申请公开了一种视频动作识别方法、装置、设备及存储介质,涉及视频识别技术领域,包括基于预设动态知识传播模型以及预设数据采样规则对接收到的待识别视频进行数据采样,得到相应的采样结果;其中,所述预设动态知识传播模型中包括相应的教师模型与学生模型;分别利用所述教师模型与所述学生模型以及所述采样结果中对应的第一采样信息与第二采样信息进行数据处理,得到分别与所述教师模型以及所述学生模型对应的第一处理结果以及第二处理结果;基于所述预设动态知识传播模型以及注意力机制对所述第一处理结果与所述第二处理结果进行处理,以得到与所述待识别视频对应的动作识别结果。本申请能够有效降低视频动作识别成本,并提高结果可信度。

    一种并行计算程序优化方法、装置、设备及存储介质

    公开(公告)号:CN118656082B

    公开(公告)日:2024-10-22

    申请号:CN202411154886.5

    申请日:2024-08-22

    摘要: 本申请公开了一种并行计算程序优化方法、装置、设备及存储介质,涉及高性能计算领域,应用于预设程序优化器,包括:获取与并行计算程序对应的源代码,并通过对源代码进行分析、语义突变生成,以得到可行突变集;基于预设优化算法对所述可行突变集中的各突变子集进行筛选,以得到相应的待测试突变子集;基于待测试突变子集对所述源代码进行代码更新、程序生成,以得到相应的突变程序;基于预设测试规则以及突变程序进行相应的程序测试与评估,并利用得到的测试评估结果得到与并行计算程序对应的目标优化补丁,以完成程序优化操作。能够有效避免现有的编译器优化方法难以人工评估及难移植的缺点,并能够在源码级别实现自动优化,提升并行编程效率。

    一种数据共享方法、装置、设备及介质

    公开(公告)号:CN118642984A

    公开(公告)日:2024-09-13

    申请号:CN202411110547.7

    申请日:2024-08-14

    IPC分类号: G06F13/16 G06T1/20 G06T1/60

    摘要: 本申请公开了一种数据共享方法、装置、设备及介质,涉及数据处理领域,包括:若通用图形处理器中的任一流式多处理器未从自身的一级高速缓存中查找到请求地址对应的数据,则将请求地址发送至与任一流式多处理器所在的目标簇对应的预测单元;在预测单元预测目标簇中存在请求地址对应的共享数据时,向目标簇中的其他流式多处理器广播请求地址,以便其他流式多处理器基于请求地址从自身的一级高速缓存中查找共享数据,并通过目标簇对应的仲裁单元从查找到共享数据的流式多处理器中确定目标流式多处理器,控制目标流式多处理器将共享数据发送至任一流式多处理器。本申请通过同一个簇中的流式多处理器之间的数据共享,可以提高数据处理性能并降低能耗。