-
公开(公告)号:CN101110080A
公开(公告)日:2008-01-23
申请号:CN200710120547.5
申请日:2007-08-21
Applicant: 北京大学
IPC: G06F17/30
Abstract: 本发明提供了一种网络地图服务中未登录地名的定位方法,其首先收集所有包含用户输入的未登录地名关键词的网页,从中提取出空间数据库中登录的地址信息,根据地名关键词与登录的地址信息之间的距离计算得到空间相关度,并根据空间聚类计算对空间相关度进行修正,取空间相关度排名在前的几个地址作为定位结果在地图上标识返回给用户。本发明的方法可以在不扩展、更新地址数据的情况下,迅速有效的提供未登录地名的地址信息,并根据文字的地址信息在地图上进行定位,可以在一定程度上提高地图搜索定位服务的质量。
-
公开(公告)号:CN111783977B
公开(公告)日:2024-04-05
申请号:CN202010317520.0
申请日:2020-04-21
IPC: G06N3/084 , G06N3/0464
Abstract: 本发明涉及一种基于分区域梯度更新的神经网络训练过程中间值存储压缩方法和装置。该方法在神经网络训练的前向传播过程中将特定区域的输入激活值保存在内存中;在神经网络训练的反向传播过程中利用保存的特定区域的输入激活值计算梯度,以更新神经网络的权重参数。所述区域是在输入激活值的长度和宽度方向上划分的区域。通过分块步长和网络稠密度确定所述特定区域,首先根据分块步长对输入激活值划分区域,并确定区域起始位置,然后根据网络稠密度确定保留区域总数。本发明对神经网络训练时需要保存的激活值进行存储优化,能够大幅降低内存成本,提高训练深度更深、规模更大的神经网络的能力,同时也可以在内存受限的设备上在线训练网络。
-
公开(公告)号:CN113204976B
公开(公告)日:2024-03-29
申请号:CN202110419207.2
申请日:2021-04-19
Applicant: 北京大学
IPC: G06F16/332 , G06F18/22 , G06N3/0455 , G06N3/084 , G06F40/35 , G06F40/44 , G06F16/38
Abstract: 本发明公开了一种实时问答方法及系统。本方法为:1)建立并训练一个多任务神经网络并训练;其中多任务神经网络包括文档编码器、问题编码器和排序器,文档编码器和问题编码器为共享同一套训练参数的预训练语言模型网络;2)用文档编码器离线预计算设定文档中各候选答案的上下文表示向量;3)用问题编码器在线编码当前问题的表示向量;4)计算该问题的表示向量与每一候选答案的上下文表示向量之间的相似度;5)找到相似度最高的候选答案在该设定文档中的位置边界信息;6)通过修改该位置边界信息,从该设定文档中确定出若干高质量候选答案;7)用排序器对各高质量候选答案进行排序,选择出排序在最前的高质量答案做为该问题的最终答案。
-
公开(公告)号:CN110532200B
公开(公告)日:2023-08-01
申请号:CN201910792500.6
申请日:2019-08-26
Applicant: 北京大学深圳研究生院 , 鹏城实验室
IPC: G06F12/0882 , G06F12/123
Abstract: 一种基于混合内存架构的内存系统,包括第一存储介质、第二存储介质和内存控制器,通过内存控制器获取近期N个被访问页面的访问信息,并依据当前被访问页面的访问信息和近期N个被访问页面的访问信息,获取当前被访问页面的权重值,并依据被访问页面的权重值对该被访问页面进行热页预测,再依据被访问页面的权重值进行页面调度。由于依据访问信息中的访问次数和物理地址对被访问页面进行热页预测,使得热页预测的效率和准确率更高,进而提高内存系统的工作效率。
-
公开(公告)号:CN110795363B
公开(公告)日:2023-05-23
申请号:CN201910791493.8
申请日:2019-08-26
Applicant: 北京大学深圳研究生院 , 鹏城实验室
IPC: G06F12/02 , G06F12/123
Abstract: 一种存储介质的热页预测方法和页面调度方法,通过获取存储介质中近期N个被访问页面的访问信息,并依据当前被访问页面的访问信息和近期N个被访问页面的访问信息,获取当前被访问页面的权重值,并依据被访问页面的权重值对该被访问页面进行热页预测,其中访问信息包括访问次数和物理地址。由于依据访问信息中的访问次数和物理地址对被访问页面进行热页预测,使得热页预测的效率和准确率更高。
-
公开(公告)号:CN115640098A
公开(公告)日:2023-01-24
申请号:CN202211197744.8
申请日:2022-09-29
Applicant: 北京大学
Abstract: 本发明涉及一种虚拟机异构内存池化方法和系统。该方法包括:根据每个虚拟机的访存情况,利用桶排序与阈值法综合决策出每个虚拟机的热页集合;当虚拟机占用页面小于DRAM容量时,利用页面迁移技术将DRAM中的空闲页面迁移到NVM中,并将原空闲页面放入虚拟机异构内存池中;当虚拟机热页集合大于DRAM容量时,向虚拟机异构内存池请求空闲页面作为超额热页的页面迁移的目标;当虚拟机热页集合小于DRAM容量时,将从虚拟机异构内存池请求的页面归还对应数量回虚拟机异构内存池。本发明解决了传统多虚拟机内存调整气球技术无法在多内存节点调整的问题;不需要在虚拟机中需求额外的驱动程序,同时也减轻了内存调整复杂的调用栈,使多虚拟机内存调整更高效。
-
公开(公告)号:CN115576644A
公开(公告)日:2023-01-06
申请号:CN202211197760.7
申请日:2022-09-29
Applicant: 北京大学
IPC: G06F9/455
Abstract: 本发明涉及一种基于PML的虚拟机页面迁移方法和系统。该方法包括:在迁移之前,根据迁移页面数量设定多线程迁移,同时利用反向映射机制,获取所有迁移页面对应的EPT页表项并清除其脏位;在迁移时首先对每个页面进行数据拷贝,然后解除旧页面映射以避免虚拟机停机;在虚拟机页面迁移的过程中,当被迁移的原页面又发生修改时,利用Intel PML技术高效的捕获被修改的脏页面,重新拷贝脏页数据;在新映射建立成功后,利用新的PFN重新填充该页面对应的EPT页表项。本发明所提出的方案充分利用Intel PML的高效追踪脏页的特性加速页面迁移对脏页的处理;同时页面迁移充分考虑虚拟化二维地址翻译特性,利用EPT重填避免额外的虚拟机退出开销。
-
公开(公告)号:CN113297102A
公开(公告)日:2021-08-24
申请号:CN202110510282.X
申请日:2021-05-11
Applicant: 北京大学
IPC: G06F12/0897 , G06F12/0871 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于地址过滤的动态缓存失效率曲线生成方法。本方法的步骤包括:1)将访存序列数据集中的各访存序列划分到各缓存组上,然后计算每个缓存组上的缓存失效率曲线;2)计算每个缓存组上的缓存失效率曲线与每一访存序列的真实缓存失效率曲线之间的距离,得到N*S个距离;3)从缓存组的维度将该N*S个距离划分为S个样本并对其进行聚类处理,保留平均距离小于设定阈值的k类缓存组;4)从访存序列的维度将该N*S个距离划分为N个样本,将k类缓存组上的距离作为每个样本的特征并聚类处理,根据分类结果选取出若干个缓存组;5)在线采集所选取缓存组上的访存序列;6)基于所采集的访存序列计算缓存失效率曲线。
-
公开(公告)号:CN113204976A
公开(公告)日:2021-08-03
申请号:CN202110419207.2
申请日:2021-04-19
Applicant: 北京大学
Abstract: 本发明公开了一种实时问答方法及系统。本方法为:1)建立并训练一个多任务神经网络并训练;其中多任务神经网络包括文档编码器、问题编码器和排序器,文档编码器和问题编码器为共享同一套训练参数的预训练语言模型网络;2)用文档编码器离线预计算设定文档中各候选答案的上下文表示向量;3)用问题编码器在线编码当前问题的表示向量;4)计算该问题的表示向量与每一候选答案的上下文表示向量之间的相似度;5)找到相似度最高的候选答案在该设定文档中的位置边界信息;6)通过修改该位置边界信息,从该设定文档中确定出若干高质量候选答案;7)用排序器对各高质量候选答案进行排序,选择出排序在最前的高质量答案做为该问题的最终答案。
-
公开(公告)号:CN111783977A
公开(公告)日:2020-10-16
申请号:CN202010317520.0
申请日:2020-04-21
Abstract: 本发明涉及一种基于分区域梯度更新的神经网络训练过程中间值存储压缩方法和装置。该方法在神经网络训练的前向传播过程中将特定区域的输入激活值保存在内存中;在神经网络训练的反向传播过程中利用保存的特定区域的输入激活值计算梯度,以更新神经网络的权重参数。所述区域是在输入激活值的长度和宽度方向上划分的区域。通过分块步长和网络稠密度确定所述特定区域,首先根据分块步长对输入激活值划分区域,并确定区域起始位置,然后根据网络稠密度确定保留区域总数。本发明对神经网络训练时需要保存的激活值进行存储优化,能够大幅降低内存成本,提高训练深度更深、规模更大的神经网络的能力,同时也可以在内存受限的设备上在线训练网络。
-
-
-
-
-
-
-
-
-