乱序处理器Cache缺失服务时间的评估方法

    公开(公告)号:CN108345763A

    公开(公告)日:2018-07-31

    申请号:CN201810283271.0

    申请日:2018-04-02

    Applicant: 东南大学

    Abstract: 本发明公开了一种乱序处理器Cache缺失服务时间的评估方法,包括,通过输入指令流和微架构参数,量化缺失状态处理寄存器(MSHR)对于相同目标地址的访存请求合并所造成的有效服务时间的影响,构建乱序处理器Cache缺失服务时间的模型;通过构建的乱序处理器Cache缺失服务时间模型计算乱序处理器Cache缺失服务时间。该方法基于指令流及微架构参数,通过数学模型快速准确的评估Cache缺失服务时间,不需要借助时钟精确型仿真,大大提升了评估Cache性能的效率。

    一种基于人工神经网络的乱序处理器Cache访存性能评估方法

    公开(公告)号:CN105653790B

    公开(公告)日:2019-03-29

    申请号:CN201511018113.5

    申请日:2015-12-29

    Abstract: 本发明公开了一种基于人工神经网络的乱序处理器Cache访存性能评估方法,访存指令乱序执行,使得利用二进制执行工具提取的堆栈距离分布在预测LRU‑Cache访存行为时精度不高。本发明将红黑树与哈希表结合,设计基于Cache组关联结构的堆栈距离提取算法,并分别计算访存顺序与乱序执行的堆栈距离分布。利用BP神经网络拟合访存顺序执行的堆栈距离分布与访存缺失次数。将基于二进制执行工具提取的堆栈距离分布导入训练好的神经网络中,可高精度地预测Cache访存行为。本发明采用人工神经网络,有效地解决了利用二进制执行工具提取的堆栈距离分布在预测Cache访存行为上精度不高的问题。

    基于人工神经网络的LRU Cache预取机制性能收益评估方法

    公开(公告)号:CN108509723A

    公开(公告)日:2018-09-07

    申请号:CN201810283273.X

    申请日:2018-04-02

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于人工神经网络的LRU Cache预取机制性能收益评估方法,选取神经网络训练参数拟合预取机制引入前的访存堆栈距离分布与预取机制引入后的Cache访问缺失次数,构建神经网络模型;计算目标程序的目标堆栈距离分布;将计算得到的目标堆栈距离分布导入构建的神经网络模型,预测不同目标程序在当前预取机制下的Cache访问缺失次数;利用堆栈距离分布计算预取机制引入前的Cache访问缺失次数,将预测的当前预取机制下的Cache访问缺失次数与预取机制引入前的Cache访问缺失次数进行对比,评估预取机制性能收益。可大幅提升Cache预取机制性能收益的预测速度。

    一种基于人工神经网络的乱序处理器Cache访存性能评估方法

    公开(公告)号:CN105653790A

    公开(公告)日:2016-06-08

    申请号:CN201511018113.5

    申请日:2015-12-29

    Inventor: 季柯丞 王芹 凌明

    CPC classification number: G06F17/5036 G06N3/08

    Abstract: 本发明公开了一种基于人工神经网络的乱序处理器Cache访存性能评估方法,访存指令乱序执行,使得利用二进制执行工具提取的堆栈距离分布在预测LRU-Cache访存行为时精度不高。本发明将红黑树与哈希表结合,设计基于Cache组关联结构的堆栈距离提取算法,并分别计算访存顺序与乱序执行的堆栈距离分布。利用BP神经网络拟合访存顺序执行的堆栈距离分布与访存缺失次数。将基于二进制执行工具提取的堆栈距离分布导入训练好的神经网络中,可高精度地预测Cache访存行为。本发明采用人工神经网络,有效地解决了利用二进制执行工具提取的堆栈距离分布在预测Cache访存行为上精度不高的问题。

    基于人工神经网络的LRU Cache预取机制性能收益评估方法

    公开(公告)号:CN108509723B

    公开(公告)日:2022-05-03

    申请号:CN201810283273.X

    申请日:2018-04-02

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于人工神经网络的LRU Cache预取机制性能收益评估方法,选取神经网络训练参数拟合预取机制引入前的访存堆栈距离分布与预取机制引入后的Cache访问缺失次数,构建神经网络模型;计算目标程序的目标堆栈距离分布;将计算得到的目标堆栈距离分布导入构建的神经网络模型,预测不同目标程序在当前预取机制下的Cache访问缺失次数;利用堆栈距离分布计算预取机制引入前的Cache访问缺失次数,将预测的当前预取机制下的Cache访问缺失次数与预取机制引入前的Cache访问缺失次数进行对比,评估预取机制性能收益。可大幅提升Cache预取机制性能收益的预测速度。

    基于聚类获取应用程序乱序访存行为模式的方法

    公开(公告)号:CN108762811B

    公开(公告)日:2022-03-22

    申请号:CN201810283802.6

    申请日:2018-04-02

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于聚类获取应用程序乱序访存行为模式的方法,对应用程序的乱序执行流进行重排序,得到访存顺序执行流,分别提取顺序执行流堆栈距离分布和乱序执行流堆栈距离分布;计算每个线程的顺序执行流堆栈距离分布和乱序执行流堆栈距离分布的堆栈距离分布变化百分比;对所有线程的堆栈距离分布变化百分比进行聚类;根据聚类结果,从每一类中选出距离质心最近的线程的程序片段。使用该方法获得的访存行为模式可以作为一个程序内部指令乱序的最小变化单位,提供更细粒度的乱序行为分析。

    一种基于统计推演的期望堆栈距离快速提取方法

    公开(公告)号:CN105677584B

    公开(公告)日:2019-01-04

    申请号:CN201511018082.3

    申请日:2015-12-29

    Abstract: 本发明公开了一种基于统计推演的期望堆栈距离快速提取方法,在借助Gem5获取目标程序访存Trace流的基础上,依照执行顺序对每次访存请求进行标号。并利用红黑树索引结构记录访存地址及标号;当重用产生时,通过将当前请求执行标号同红黑树中记录的前次访存标号相减,获取重用距离;本发明通过采样的方法,找出重用距离与基于Cache组关联的重用距离之间的转换关系,推导了重用距离分布与期望堆栈距离分布之间的转换关系。由于重用距离提取时间成本较低,且基于Cache组关联结构的期望堆栈距离分布可从上述的两次转换过程中获得。所以,本发明大幅提升了利用堆栈距离评估LRU‑Cache访存行为的速度。

    基于聚类获取应用程序乱序访存行为模式的方法

    公开(公告)号:CN108762811A

    公开(公告)日:2018-11-06

    申请号:CN201810283802.6

    申请日:2018-04-02

    Applicant: 东南大学

    CPC classification number: G06F9/3836 G06K9/6223

    Abstract: 本发明公开了一种基于聚类获取应用程序乱序访存行为模式的方法,对应用程序的乱序执行流进行重排序,得到访存顺序执行流,分别提取顺序执行流堆栈距离分布和乱序执行流堆栈距离分布;计算每个线程的顺序执行流堆栈距离分布和乱序执行流堆栈距离分布的堆栈距离分布变化百分比;对所有线程的堆栈距离分布变化百分比进行聚类;根据聚类结果,从每一类中选出距离质心最近的线程的程序片段。使用该方法获得的访存行为模式可以作为一个程序内部指令乱序的最小变化单位,提供更细粒度的乱序行为分析。

    超标量乱序处理器稳定状态指令吞吐率建模方法

    公开(公告)号:CN108519906A

    公开(公告)日:2018-09-11

    申请号:CN201810229640.8

    申请日:2018-03-20

    Applicant: 东南大学

    Abstract: 本发明公开了一种超标量乱序处理器稳定状态指令吞吐率建模方法,获取每个统计阶段与稳态平均吞吐率相关的微架构无关参数,所述微架构无关参数至少包括依赖链路延迟分布;利用聚类算法进行分类,选取得到神经网络的训练集;将所选取的神经网络的训练集中的微架构无关参数作为神经网络的输入,将通过时序精确仿真获得对应训练集的线程稳态指令吞吐率作为神经网络的输出,对神经网络的输入和输出进行拟合,通过调节神经网络的迭代次数、网络拓扑结构、传递函数以及预设训练精度,训练得到给定硬件的稳态指令吞吐率神经网络模型。根据指令依赖链路延迟分布的微架构无关的特征,可以快速准确地预测给定微架构的超标量乱序处理器稳态下的指令吞吐率。

    超标量乱序处理器稳定状态指令吞吐率建模方法

    公开(公告)号:CN108519906B

    公开(公告)日:2022-03-22

    申请号:CN201810229640.8

    申请日:2018-03-20

    Applicant: 东南大学

    Abstract: 本发明公开了一种超标量乱序处理器稳定状态指令吞吐率建模方法,获取每个统计阶段与稳态平均吞吐率相关的微架构无关参数,所述微架构无关参数至少包括依赖链路延迟分布;利用聚类算法进行分类,选取得到神经网络的训练集;将所选取的神经网络的训练集中的微架构无关参数作为神经网络的输入,将通过时序精确仿真获得对应训练集的线程稳态指令吞吐率作为神经网络的输出,对神经网络的输入和输出进行拟合,通过调节神经网络的迭代次数、网络拓扑结构、传递函数以及预设训练精度,训练得到给定硬件的稳态指令吞吐率神经网络模型。根据指令依赖链路延迟分布的微架构无关的特征,可以快速准确地预测给定微架构的超标量乱序处理器稳态下的指令吞吐率。

Patent Agency Ranking