采用时序推测型SRAM阵列的Cache行映射与替换方法

    公开(公告)号:CN110782934A

    公开(公告)日:2020-02-11

    申请号:CN201910921924.8

    申请日:2019-09-27

    Abstract: 本发明提出采用时序推测型SRAM阵列的Cache行映射与替换方法,属于处理器体系结构技术研究领域。本发明提出的Cache中的数据阵列采用时序推测型SARM阵列,提出的映射替换方法与装置通过采用Cache行重映射,实现了每组Cache单元中“强”行所占比例大幅提升、访存请求命中“强”行概率大幅提升,通过优化Cache行替换策略将频繁访问的Cache行替换到“强”行,从而降低读访问延迟,提高Cache的性能。相较于传统的多管SRAM单元,ECC纠错机制等方案,本发明所提出的方案具有更好的性能、能耗和面积指标。

    一种加速软件trace信息提取的采样方法

    公开(公告)号:CN110781062B

    公开(公告)日:2023-08-04

    申请号:CN201910922145.X

    申请日:2019-09-27

    Abstract: 本发明提出一种加速软件trace信息提取的采样方法,涉及计算机体系结构与建模技术领域。本发明提出的采样方法,实现对软件trace信息进行两级采样,包括:第一级为区间采样,包括程序特征向量的采集和归一化处理、在线阶段分类、以及采用指数变化步长的采样方法;第二级为区间内采样,包括采样区间内trace信息的采集和存储。该采样方法面向处理器解析模型所需的trace信息提取,通过采集trace信息中具有代表性片段的软件特征信息,提升trace信息的分析统计速度,减少利用二进制分析工具提取trace信息的耗时,有效提高采用解析模型进行处理器性能分析的效率。通过合理配置两级采样的各类参数,可以保证较高的性能评估准确度,并可降低10倍左右的trace信息分析统计时间开销。

    一种基于机器学习的有效指令窗口大小评估方法

    公开(公告)号:CN110750856B

    公开(公告)日:2023-06-06

    申请号:CN201910846458.1

    申请日:2019-09-06

    Inventor: 凌明 赵彬

    Abstract: 本发明提出一种基于机器学习的有效指令窗口大小评估方法,属于计算机体系结构与建模领域。该方法以有效ROB作为因变量,并以该有效ROB所对应的193维微架构无关参数及6维硬件配置参数作为自变量,采用控制变量法设计出训练样本集,采用机器学习方法对有效指令窗口大小进行建模,并采用训练样本集训练模型以获得能够预测有效指令窗口大小的经验模型。本发明以有效指令窗口大小代替ROB窗口大小,从而提高CPI栈理论模型的精度。另外,本发明实现了对有效指令窗口大小的评估,也可以作为ROB大小选择的评估依据。

    一种基于机器学习的有效指令窗口大小评估方法

    公开(公告)号:CN110750856A

    公开(公告)日:2020-02-04

    申请号:CN201910846458.1

    申请日:2019-09-06

    Inventor: 凌明 赵彬

    Abstract: 本发明提出一种基于机器学习的有效指令窗口大小评估方法,属于计算机体系结构与建模领域。该方法以有效ROB作为因变量,并以该有效ROB所对应的193维微架构无关参数及6维硬件配置参数作为自变量,采用控制变量法设计出训练样本集,采用机器学习方法对有效指令窗口大小进行建模,并采用训练样本集训练模型以获得能够预测有效指令窗口大小的经验模型。本发明以有效指令窗口大小代替ROB窗口大小,从而提高CPI栈理论模型的精度。另外,本发明实现了对有效指令窗口大小的评估,也可以作为ROB大小选择的评估依据。

    一种加速软件trace信息提取的采样方法

    公开(公告)号:CN110781062A

    公开(公告)日:2020-02-11

    申请号:CN201910922145.X

    申请日:2019-09-27

    Abstract: 本发明提出一种加速软件trace信息提取的采样方法,涉及计算机体系结构与建模技术领域。本发明提出的采样方法,实现对软件trace信息进行两级采样,包括:第一级为区间采样,包括程序特征向量的采集和归一化处理、在线阶段分类、以及采用指数变化步长的采样方法;第二级为区间内采样,包括采样区间内trace信息的采集和存储。该采样方法面向处理器解析模型所需的trace信息提取,通过采集trace信息中具有代表性片段的软件特征信息,提升trace信息的分析统计速度,减少利用二进制分析工具提取trace信息的耗时,有效提高采用解析模型进行处理器性能分析的效率。通过合理配置两级采样的各类参数,可以保证较高的性能评估准确度,并可降低10倍左右的trace信息分析统计时间开销。

    一种基于间歇采样和机器学习模型的计步方法

    公开(公告)号:CN116975612A

    公开(公告)日:2023-10-31

    申请号:CN202210393035.0

    申请日:2022-04-14

    Applicant: 东南大学

    Inventor: 凌明 符栋伟

    Abstract: 本发明公开了一种基于间歇采样和机器学习模型的计步方法。本发明针对传统计步流程需要持续采集三轴加速度数据,无法进入休眠模式,造成整体功耗较高的问题,提出了一种设备间歇工作进行运动量采样,并通过构建基于机器学习算法的运动量模型以实现计步预测。该方案首先让加速度计持续工作一段时间以实现参数采集。在工作周期将步数进行汇总,然后设置休眠占空比,将对应工作周期置为休眠,通过SVM支持向量机模型进行预测休眠周期步数,能够有效降低系统整体能耗。

    一种面向间歇计步的动态占空比采样方法

    公开(公告)号:CN116962568A

    公开(公告)日:2023-10-27

    申请号:CN202210394562.3

    申请日:2022-04-14

    Applicant: 东南大学

    Inventor: 凌明 符栋伟

    Abstract: 本发明公开了一种面向间歇计步的动态占空比采样方法。本发明针对传统计步过程中需要保持加速度计持续运行实现计步,导致系统整体功耗过高的问题。设计了一种面向间歇计步的动态占空比采样方法。能够实时分析采集到的数据,并依据数据的信息熵来动态调整工作模式以预测步数。该方案首先让系统持续工作,确定各模式的信息熵值,然后默认模式处于活跃状态,即系统在低占空比模式下间歇采样,阶段性计算步数信息熵,当发现运动量较不活跃时,休眠占空比适当增大。当发现处于静止状态时,将休眠占空比置为最大值,这样可以进一步降低系统整体能耗。

    超标量乱序处理器稳定状态指令吞吐率建模方法

    公开(公告)号:CN108519906B

    公开(公告)日:2022-03-22

    申请号:CN201810229640.8

    申请日:2018-03-20

    Applicant: 东南大学

    Abstract: 本发明公开了一种超标量乱序处理器稳定状态指令吞吐率建模方法,获取每个统计阶段与稳态平均吞吐率相关的微架构无关参数,所述微架构无关参数至少包括依赖链路延迟分布;利用聚类算法进行分类,选取得到神经网络的训练集;将所选取的神经网络的训练集中的微架构无关参数作为神经网络的输入,将通过时序精确仿真获得对应训练集的线程稳态指令吞吐率作为神经网络的输出,对神经网络的输入和输出进行拟合,通过调节神经网络的迭代次数、网络拓扑结构、传递函数以及预设训练精度,训练得到给定硬件的稳态指令吞吐率神经网络模型。根据指令依赖链路延迟分布的微架构无关的特征,可以快速准确地预测给定微架构的超标量乱序处理器稳态下的指令吞吐率。

    一种基于统计推演的期望堆栈距离快速提取方法

    公开(公告)号:CN105677584A

    公开(公告)日:2016-06-15

    申请号:CN201511018082.3

    申请日:2015-12-29

    Inventor: 季柯丞 王芹 凌明

    CPC classification number: G06F12/0862 G06F12/0893

    Abstract: 本发明公开了一种基于统计推演的期望堆栈距离快速提取方法,在借助Gem5获取目标程序访存Trace流的基础上,依照执行顺序对每次访存请求进行标号。并利用红黑树索引结构记录访存地址及标号;当重用产生时,通过将当前请求执行标号同红黑树中记录的前次访存标号相减,获取重用距离;本发明通过采样的方法,找出重用距离与基于Cache组关联的重用距离之间的转换关系,推导了重用距离分布与期望堆栈距离分布之间的转换关系。由于重用距离提取时间成本较低,且基于Cache组关联结构的期望堆栈距离分布可从上述的两次转换过程中获得。所以,本发明大幅提升了利用堆栈距离评估LRU-Cache访存行为的速度。

    一种SoC集成的多端口DDR2/3调度器及调度方法

    公开(公告)号:CN103150216B

    公开(公告)日:2015-12-02

    申请号:CN201310062166.1

    申请日:2013-02-27

    Applicant: 东南大学

    Abstract: 本发明公开了一种SoC集成的多端口DDR2/3调度器及调度方法,该调度器在传统调度器的输入端串联了调度IP核,在传统调度器的输出端串联了状态机IP核,其中调度IP核又包括端口查找表和改进型调度器。通过动态查询端口查找表中每个端口的访存类型,将延时敏感型、带宽敏感型和期限敏感型访存要求按照相应的调度策略进行调度,然后由传统调度器和状态机IP核做二次命令排队,最终生成发送给DRAM芯片的命令队列。满足了LCD控制器等期限敏感型设备需求,同时有效降低了延时敏感型设备的平均响应时间,并提升了带宽敏感型设备的有效带宽利用率,最终提升了系统整体的QoS。

Patent Agency Ranking