-
公开(公告)号:CN102521158B
公开(公告)日:2014-09-24
申请号:CN201110415405.8
申请日:2011-12-13
Applicant: 北京北大众志微系统科技有限责任公司
IPC: G06F12/08
CPC classification number: G06F12/0862 , G06F2212/6026 , Y02D10/13
Abstract: 本发明提供了一种实现数据预取的方法及装置,其中预取器装置包括:访存模式识别单元将全局失效地址流划分为局部失效地址流,按时间顺序将局部失效地址流中最近发生的两个缓存失效的地址信息记录为历史访存信息,并根据该记录捕获跨距访存模式并生成相应的预取地址。本发明通过改善差值相关预取器的存储利用效率,并通过减少对预取器性能提升没有贡献的冗余预取,使得预取器在相同存储开销的情况下能够获得更好的性能优化效果,同时可有效降低预取器访问片上缓存的带宽需求和功耗开销。
-
公开(公告)号:CN102662862A
公开(公告)日:2012-09-12
申请号:CN201210077583.9
申请日:2012-03-22
Applicant: 北京北大众志微系统科技有限责任公司
IPC: G06F12/08
CPC classification number: Y02D10/13
Abstract: 本发明涉及一种在处理器中实现混合预取的方法及相应的装置,使用全局历史缓冲器按时间顺序保存一份失效地址历史信息,并使用多个索引表和全局历史缓冲器中的多组指针实现多种数据预取方法。在查找可重复的访存模式并产生预取请求时,本发明按照某种顺序逐个使用各预取方法查找相应的局部失效地址流。为减少查找的时间和能耗开销,本发明在某种预取方法下找到可重复的访存模式时,即停止查找并产生预取请求,不再查找其余预取方法的局部失效地址流。本发明能够以较低的存储开销和能耗开销同时实现多种数据预取方法,从而结合利用程序运行过程中的多种访存规律提高预取的性能。
-
公开(公告)号:CN102156633A
公开(公告)日:2011-08-17
申请号:CN201110096900.7
申请日:2011-04-18
Applicant: 北京北大众志微系统科技有限责任公司
IPC: G06F9/38
CPC classification number: G06F9/383
Abstract: 本发明公开了一种数据预取方法及系统,克服现有技术未很好地将预执行和跨距预取融合的不足。该方法包括:跨距预取器监测二级缓存失效访存序列,在捕获到跨距访存模式时触发预取请求;监测到二级缓存访问发生失效时,处理器对当前寄存器状态进行备份,转换到预执行模式,执行发生二级缓存失效的指令的后续指令,对非规则的访存模式进行精确预取,获得预执行结果及其有效状态保存到缓冲器中,并从捕获的真实访存信息中提取出有用信息指导跨距预取器及早发出预取请求;引发预执行的二级缓存失效指令完成主存访问后,处理器清空流水线,恢复备份的寄存器状态,从引发预执行的访存指令开始继续执行。本发明有效提升处理器的访存延时包容能力。
-
公开(公告)号:CN101673254B
公开(公告)日:2011-08-17
申请号:CN200910165281.5
申请日:2009-08-14
Applicant: 北京北大众志微系统科技有限责任公司
Abstract: 本发明公开了一种嵌入式x86处理器应用于通用片上总线的方法及系统芯片,该系统芯片包括传统功能部件,与该嵌入式x86处理器连接,用于接收和过滤来自该嵌入式x86处理器的交易,识别并处理特殊周期和传统信号;接口转换装置,接收该嵌入式x86处理器的信号并与AMBA AHB总线连接,该接口转换装置用于将嵌入式x86处理器的I/O交易转换成32位或64位AMBA AHB总线交易,以及I/O空间向存储空间的映射;传统设备,连接于AMBA总线;其中,通过该传统功能部件和该接口转换装置,使得该嵌入式x86处理器作为总线控制单元应用于基于AMBA总线结构的系统芯片上。
-
公开(公告)号:CN102662862B
公开(公告)日:2015-01-21
申请号:CN201210077583.9
申请日:2012-03-22
Applicant: 北京北大众志微系统科技有限责任公司
IPC: G06F12/08
CPC classification number: Y02D10/13
Abstract: 本发明涉及一种在处理器中实现混合预取的方法及相应的装置,使用全局历史缓冲器按时间顺序保存一份失效地址历史信息,并使用多个索引表和全局历史缓冲器中的多组指针实现多种数据预取方法。在查找可重复的访存模式并产生预取请求时,本发明按照某种顺序逐个使用各预取方法查找相应的局部失效地址流。为减少查找的时间和能耗开销,本发明在某种预取方法下找到可重复的访存模式时,即停止查找并产生预取请求,不再查找其余预取方法的局部失效地址流。本发明能够以较低的存储开销和能耗开销同时实现多种数据预取方法,从而结合利用程序运行过程中的多种访存规律提高预取的性能。
-
公开(公告)号:CN103049398A
公开(公告)日:2013-04-17
申请号:CN201210593796.7
申请日:2012-12-31
Applicant: 北京北大众志微系统科技有限责任公司
IPC: G06F12/08
CPC classification number: Y02D10/13
Abstract: 一种无用预取过滤方法,涉及微处理器访存性能优化领域,能够在不降低数据预取性能的同时减少无用预取,以降低数据预取的能耗和带宽开销,提高数据预取的能效性。所述过滤方法,在某个预取信息被发出时,将所述预取信息读取的预取数据添加到缓存中,将保存所述预取数据的缓存组的缓存行作为该预取信息的预取行,若缓存组的所有缓存行均有效,则从缓存组中确定一个有效的缓存行作为该预取信息的替换行替换出所述缓存组,将所述已发出的预取信息的预取行地址和替换行地址保存在预取历史信息表中。能够在对有用预取影响较小的情况下有效减少无用预取,在保持或提高数据预取性能的情况下有效降低数据预取的能耗和带宽开销,提高数据预取的能效性。
-
公开(公告)号:CN102184127A
公开(公告)日:2011-09-14
申请号:CN201110131830.4
申请日:2011-05-20
Applicant: 北京北大众志微系统科技有限责任公司
IPC: G06F11/00
Abstract: 本发明提供了一种实现处理器预执行的方法及相应的装置,方法包括:处理器在正常执行指令期间,当检测到发生长延时缓存失效时备份寄存器;在预执行指令期间,对预执行的每一指令标记预执行结果的状态;对引发长延时缓存失效的Load指令进行值预测,并使用经该值预测的预测值预执行与该Load指令数据相关的后续指令;按程序顺序将预执行结果保存在指令复用队列IRQ,并根据标记的状态设置相应的标志。本发明结合值预测和指令复用两种技术,充分发挥了各自的优势,在提高处理器性能的同时降低其预执行的能耗开销,因此提高处理器的能效性。
-
公开(公告)号:CN101673254A
公开(公告)日:2010-03-17
申请号:CN200910165281.5
申请日:2009-08-14
Applicant: 北京北大众志微系统科技有限责任公司
Abstract: 本发明公开了一种嵌入式x86处理器应用于通用片上总线的方法及系统芯片,该系统芯片包括传统功能部件,与该嵌入式x86处理器连接,用于接收和过滤来自该嵌入式x86处理器的交易,识别并处理特殊周期和传统信号;接口转换装置,接收该嵌入式x86处理器的信号并与AMBA AHB总线连接,该接口转换装置用于将嵌入式x86处理器的I/O交易转换成32位或64位AMBA AHB总线交易,以及I/O空间向存储空间的映射;传统设备,连接于AMBA总线;其中,通过该传统功能部件和该接口转换装置,使得该嵌入式x86处理器作为总线控制单元应用于基于AMBA总线结构的系统芯片上。
-
公开(公告)号:CN102184127B
公开(公告)日:2013-11-06
申请号:CN201110131830.4
申请日:2011-05-20
Applicant: 北京北大众志微系统科技有限责任公司
IPC: G06F11/00
Abstract: 本发明提供了一种实现处理器预执行的方法及相应的装置,方法包括:处理器在正常执行指令期间,当检测到发生长延时缓存失效时备份寄存器;在预执行指令期间,对预执行的每一指令标记预执行结果的状态;对引发长延时缓存失效的Load指令进行值预测,并使用经该值预测的预测值预执行与该Load指令数据相关的后续指令;按程序顺序将预执行结果保存在指令复用队列IRQ,并根据标记的状态设置相应的标志。本发明结合值预测和指令复用两种技术,充分发挥了各自的优势,在提高处理器性能的同时降低其预执行的能耗开销,因此提高处理器的能效性。
-
公开(公告)号:CN102521158A
公开(公告)日:2012-06-27
申请号:CN201110415405.8
申请日:2011-12-13
Applicant: 北京北大众志微系统科技有限责任公司
IPC: G06F12/08
CPC classification number: G06F12/0862 , G06F2212/6026 , Y02D10/13
Abstract: 本发明提供了一种实现数据预取的方法及装置,其中预取器装置包括:访存模式识别单元将全局失效地址流划分为局部失效地址流,按时间顺序将局部失效地址流中最近发生的两个缓存失效的地址信息记录为历史访存信息,并根据该记录捕获跨距访存模式并生成相应的预取地址。本发明通过改善差值相关预取器的存储利用效率,并通过减少对预取器性能提升没有贡献的冗余预取,使得预取器在相同存储开销的情况下能够获得更好的性能优化效果,同时可有效降低预取器访问片上缓存的带宽需求和功耗开销。
-
-
-
-
-
-
-
-
-