适用于多发射处理器指令重排的启发式方法及装置

    公开(公告)号:CN116028127A

    公开(公告)日:2023-04-28

    申请号:CN202310163053.4

    申请日:2023-02-14

    Abstract: 本发明公开了适用于多发射处理器指令重排的启发式方法,包括数据准备阶段根据指令集信息和功能单元信息获取各指令运行时参数,由指令间的数据依赖关系获取数据依赖图,对数据依赖图进行处理获得各指令的发射优先级,然后在模拟运行阶段保证指令发射过程满足并行发射指令条数、可用功能单元数量、流水线功能限制的约束条件。本发明同时还提供了适用于多发射处理器指令重排的装置。本发明解决了汇编代码在国产申威众核处理器不同代间迁移引起应用程序性能下降的指令并行优化的问题,一方面提升程序移植效率,另一方面相较于现有算法,攻克应用汇编程序库对从核双发射流水微结构的适配性难题。

    多低位宽浮点数融合点积加计算装置及方法

    公开(公告)号:CN119987714A

    公开(公告)日:2025-05-13

    申请号:CN202411745856.1

    申请日:2024-11-29

    Applicant: 浙江大学

    Abstract: 本发明旨在解决同长度输入下对正确舍入的多种低位宽浮点数支持中的融合点积加的优化问题,提出了一种多低位宽浮点数融合点积加计算装置与方法。所述计算装置包括以下模块:输入分割和检测模块、符号处理模块、指数处理模块、尾数处理和计算模块、异常检测模块、尾数数据路径模块、前导零检测模块、尾数规格化模块、舍入模块、指数调整模块、通常输出模块、异常输出模块和输出模块。所述方法基于对尾数数据路径的分析,针对FP4和FP6提出并使用了一种新的尾数移位方式;针对FP8则提出并使用了一种可实现正确舍入的尾数分配方案。此外,还提出了针对低位宽浮点数指数的比较和排序方案,从而能够实现正确舍入的多低位宽浮点数融合点积加计算。

Patent Agency Ranking