-
公开(公告)号:CN114840299A
公开(公告)日:2022-08-02
申请号:CN202110144319.1
申请日:2021-02-02
Applicant: 北京大学
IPC: G06F9/455 , G06F12/1009
Abstract: 本发明涉及一种申威架构下的改进嵌套页表内存虚拟化方法与系统。该方法包括:在查询TLB发生TLB未命中时,MMU访问四级客户机进程页表进行页表查询,在每一级的访问中,都需要首先访问NPT MMU进行嵌套页表查询,通过平滑嵌套页表将客户机物理地址转换为宿主机物理地址;在嵌套页表查询出现映射缺失时,CPU切换客户机上下文到宿主机上下文中以进行嵌套页表缺页中断处理。本发明所提出的方案基于申威架构特点尤其是可编程接口的特性,继承了传统嵌套页表模型复杂度低、页表同步开销小的优势并且消除了传统嵌套页表模型因多次页表查询而产生的访存开销;不需要复杂的硬件支持,也不会和影子页表模型一样引入额外的页表同步开销。
-
公开(公告)号:CN112363960B
公开(公告)日:2022-07-22
申请号:CN202011085016.9
申请日:2020-10-12
IPC: G06F12/1009 , G06F9/455 , G06F9/50
Abstract: 本发明涉及一种新型基于影子页表机制的内存虚拟化方法与系统。该方法的步骤包括:捕获客户机操作系统发出的TLB刷新指令,并解码TLB刷新指令,以相同的粒度使相应的影子页表项无效;当CPU访问TLB发生TLB未命中时,内存管理单元查询影子页表,在发现相应的影子页表项无效后,进行缺页处理来修正影子页表;利用缺页处理后的影子页表完成客户机虚拟地址到宿主机物理地址的地址转换。本发明利用TLB与影子页表同时刷新的方式来同步影子页表与客户机进程页表,从根本上消除了传统影子页表的写保护同步开销大的弊端,同时相较于硬件辅助虚拟化技术,无需引入额外的页表查询开销,显著提高了内存虚拟化效率。
-
公开(公告)号:CN111258927B
公开(公告)日:2022-05-03
申请号:CN201911309038.6
申请日:2019-12-18
IPC: G06F12/0802 , G06F12/0893
Abstract: 本发明提出一种基于采样的应用程序CPU末级高速缓存缺失率曲线的预测方法,属于计算机体系结构领域,包括以下步骤:让目标程序在处理器上运行,设计一组访存模式可控的微程序来访问指定末级高速缓存LLC组,与目标程序在指定LLC组发生资源竞争;通过采样收集一段时间内不同LLC组上的缓存缺失数量;通过控制微程序的访存模式改变它所占用的缓存块数量,改变目标程序所在指定LLC组上占用的缓存大小;计算未被微程序影响的LLC组上的缓存缺失数与受影响的组上缓存缺失数之差,据此得到目标程序的缺失率曲线。本方法既能消除事离线探测方法的局限性,又能避免在线预测方法对程序性能的干扰。
-
公开(公告)号:CN110865869B
公开(公告)日:2022-05-03
申请号:CN201911070571.1
申请日:2019-11-05
Applicant: 北京大学
IPC: G06F9/455 , G06F11/30 , G06F11/32 , G06F11/34 , G06F12/1027 , G06F12/123
Abstract: 本发明公开了一种申威架构上的虚拟机访存特征提取方法及系统,其通过“热页集”机制、“置位‑中断”方法和“访存失效率曲线”构建方法,获取虚拟机访存序列的重用距离分布、内存缺页率、访内存缺页率曲线,得到虚拟机工作集大小。本发明在申威平台上首次实现了动态访存特征提取提取技术,成功地绘制高精度的内存缺失率曲线并计算出准确的工作集大小,为下一步根据工作集大小进行有效的多虚拟机内存动态调配以提高内存利用率提供基础条件。
-
公开(公告)号:CN112817722A
公开(公告)日:2021-05-18
申请号:CN202110141136.4
申请日:2021-02-01
Abstract: 本发明公开了一种基于优先级的分时调度方法、终端及存储介质,方法包括:确定各个待调度任务的所属用户;获取第一预设时长内各个用户已运行任务的时长,根据各个用户已运行任务的时长在各个待调度任务中确定目标任务;为目标任务分配运行资源。本发明在对各个用户的任务进行调度时,根据一定时长内各个用户已经运行任务的时长确定当前需要被分配运行资源的任务,可以实现各个用户的任务完成进度更平均。
-
公开(公告)号:CN108241472B
公开(公告)日:2021-03-12
申请号:CN201711250255.3
申请日:2017-12-01
Applicant: 北京大学
Abstract: 本发明涉及一种支持局部性表达函数的大数据处理方法和系统。该方法包括以下步骤:1)发掘大数据处理系统中所处理的数据的局部性,形成局部性表达函数;2)将局部性表达函数部署在大数据处理系统中;3)大数据处理系统按照局部性表达函数分配工作任务。所述大数据处理系统采用分布式存储方式或集中式存储方式;所述局部性表达函数在在大数据处理系统中的部署方式分为两种类型:内置式冷启动模式、外置式热插拔模式。本发明通过发掘数据中隐藏的局部性,并且使用自定义的局部性函数表达出来,最终被大数据处理系统识别,按照局部性来分配机器执行任务,从而达到优化处理效率。
-
公开(公告)号:CN112363824A
公开(公告)日:2021-02-12
申请号:CN202011084199.2
申请日:2020-10-12
IPC: G06F9/50 , G06F12/1009 , G06F9/455
Abstract: 本发明涉及一种申威架构下的内存虚拟化方法与系统。该方法包括:建立存储影子页表基地址的缓冲区;当CPU查询TLB发生TLB未命中时,CPU访问所述缓冲区获取当前进程的影子页表基地址,将影子页表基地址加载进入内存管理单元,开始页表查询;当页表查询中出现映射缺失时,CPU切换客户机上下文到宿主机上下文中以进行缺页中断处理;将缺页中断处理后获得的虚实地址转换映射直接填入相应的TLB,实现TLB预取;CPU再次查询TLB,完成客户机虚拟地址到宿主机物理地址的地址转换。本发明基于申威架构软件管理的TLB特性,实现了影子页表和TLB的同时刷新,从而实现了影子页表和客户机进程页表的同步。
-
公开(公告)号:CN111783976A
公开(公告)日:2020-10-16
申请号:CN202010317078.1
申请日:2020-04-21
Abstract: 本发明涉及一种基于窗口梯度更新的神经网络训练过程中间值存储压缩方法和装置。该方法在神经网络训练的前向传播过程中,选择部分通道的输入激活值保存在内存中;在神经网络训练的反向传播过程中,利用保存的部分通道的输入激活值计算梯度,以更新神经网络的权重参数。通过窗口选择所述部分通道,通过超参数网络稠密度决定窗口大小,即窗口内包含的通道数占总通道数的比例。通过窗口选择所述部分通道的步骤包括:确定窗口的起始位置;根据网络稠密度确定窗口大小。本发明对神经网络训练时需要保存的激活值进行存储优化,能够大幅降低内存成本,提高训练深度更深、规模更大的神经网络的能力,同时也可以在内存受限的设备上在线训练网络。
-
公开(公告)号:CN103984599A
公开(公告)日:2014-08-13
申请号:CN201410146873.3
申请日:2014-04-14
Applicant: 北京大学
IPC: G06F9/50
Abstract: 本发明公开了一种提高操作系统大页使用率的方法。本方法为:1)系统在每一进程的虚拟地址空间数据结构中增加一变量a,记录为进程已经分配虚拟地址的堆顶位置;2)进程启动时,系统将a初始化为0;当该进程调用堆顶设置函数进行内存申请时,向系统传入一堆顶参数b;3)系统根据该进程上一次请求的堆顶位置和当前请求的堆顶位置b,计算堆顶位置向上大页对齐之后的值c;4)系统将a的当前值赋值给该进程的记录已分配内存最高堆地址变量,并将其与c进行比较:如果小于c,则根据二者差值增大该进程的堆栈空间;如果小于c,则进行内存释放,如果相等则不进行内存调用。本发明充分提升了大页的使用率,进而提升程序的性能。
-
公开(公告)号:CN103984589A
公开(公告)日:2014-08-13
申请号:CN201410171400.9
申请日:2014-04-25
Applicant: 北京大学
Abstract: 本发明公开了一种基于虚拟机实现计算机实验教学的上机环境建立方法。本方法为:1)学生在系统Web服务主页上完成认证登陆,然后选择当前课程;其中,课程主镜像文件已被部署到各物理节点上;2)通过交互界面查看与管理虚拟机状态;3)通过系统Web服务页面获取虚拟机桌面;然后在浏览器中使用虚拟机。与现有技术相比,本发明通过虚拟化技术能帮助屏蔽底层物理硬件差异,为上层用户提供多样化的执行环境,且虚拟机之间相互隔离,因此用户可使用私有虚拟机作为上机平台,自由地安装个性化软件,用户数据存储在虚拟机镜像中,能保证数据安全。
-
-
-
-
-
-
-
-
-