面向存储架构的重复数据删除方法、装置及可读介质

    公开(公告)号:CN116974472A

    公开(公告)日:2023-10-31

    申请号:CN202310931227.7

    申请日:2023-07-27

    Applicant: 厦门大学

    Abstract: 本发明公开了一种面向存储架构的重复数据删除方法、装置及可读介质,通过构建内存缓存协同的源地址索引结构和指纹索引桶结构,源地址索引结构包括具有源地址桶结构的临时索引缓存、中度访问源地址索引结构、冷访问源地址索引结构和频繁访问源地址索引结构,指纹索引桶结构包括具有指纹桶结构的指纹索引结构、历史指纹索引结构、历史指纹布隆过滤器结构和计数布隆过滤器;获取访问数据,根据访问数据在源地址索引结构和指纹索引桶结构中查找,根据查找结果进行重复数据删除操作,减少新型存储架构下传统数据重删带来的空间开销和时间开销问题,并提高整体存储系统访问性能。

    一种图邻接表的数据压缩格式及其图算法的计算方法

    公开(公告)号:CN116363234A

    公开(公告)日:2023-06-30

    申请号:CN202310116826.3

    申请日:2023-02-15

    Applicant: 厦门大学

    Abstract: 本公开提供了一种图邻接表的数据压缩格式及其图算法的计算方法,根据用户指定的子图的结构特征在一个规模较大的图数据上查找子图,并对检索到的全部子图中的所有图的节点的相关边来进行编码以此来对邻接表图数据进行重新编码,在编码完用户输入的图数据后,根据用户给定的f来重新定义图的几种基本遍历操作的例程,基于这些例程可以对压缩后的图运行常规的图算法,最终的结果也能够根据编码时使用的编码映射方式容易还原。本公开可以减少大规模的图邻接表在运行图算法时占用的内存空间,进而可以充分发挥在单机共享内存系统上进行图计算的优势。

    一种面向静态漏洞检测的第三方库函数摘要构建方法

    公开(公告)号:CN115859306A

    公开(公告)日:2023-03-28

    申请号:CN202211673314.9

    申请日:2022-12-26

    Applicant: 厦门大学

    Abstract: 本发明提出了一种面向静态漏洞检测的第三方库函数摘要构建方法,包括:建立程序P摘要为两层摘要(G,S),以及一个漏洞规范(δsrc,δsink),其中G是程序P的程序依赖图PDG,作为通用摘要,S是程序P的漏洞特定摘要,δsrc和δsink表示source结点和sink结点应该满足的属性;提出了一种两层摘要设计:一层使用被称为程序依赖图的线性大小的程序中间表示来紧凑地编码路径条件,另一层则编码漏洞特定属性的可达性,本发明提供的摘要构建方法能够极大地减少摘要生成的时间和摘要存储的空间,利用本发明提出的第三方库函数摘要构建方法,在检测时能够大大提升检测速度,节省检测内存。

    基于层冻结的混合专家模型训练系统

    公开(公告)号:CN119647560A

    公开(公告)日:2025-03-18

    申请号:CN202411692716.2

    申请日:2024-11-25

    Applicant: 厦门大学

    Abstract: 本发明公开了基于层冻结的混合专家模型训练系统,涉及模型训练领域,包括外存、冻结控制器、资源分配控制器和若干计算设备;外存存储用于训练混合专家模型的数据集;冻结控制器根据专家选择路径进行冻结决策,交与计算设备执行;资源分配控制器基于冻结层专家选择路径执行词元分组算法计算专家热度,根据专家热度分配计算资源;计算设备存储混合专家模型,执行模型训练操作,根据层冻结决策执行层冻结任务,将冻结层专家选择路径和专家选择路径分别反馈给资源分配控制器和冻结控制器。本发明通过层冻结技术进行混合专家模型的训练,保持模型精度的同时减小训练成本;基于词源分组算法进行计算资源分配,实现设备负载均衡。

    基于零预留空间固态硬盘的数据管理方法、装置及可读介质

    公开(公告)号:CN119271569A

    公开(公告)日:2025-01-07

    申请号:CN202411305942.0

    申请日:2024-09-19

    Applicant: 厦门大学

    Abstract: 本发明公开了一种基于零预留空间固态硬盘的数据管理方法、装置及可读介质,包括:获取当前周期的待写入的数据、垃圾回收的数据量和剩余TLC类型的空闲空间容量,根据待写入的数据的预测热度以伪编程的方式将待写入的数据编程到对应热度类型的SLC类型的闪存块,对热度管理链表进行更新,得到更新后的热度管理链表;若满足阈值判断条件,则在更新后的热度管理链表中选择最佳的SLC闪存块作为重编程目标,并以重编程的方式编程到TLC类型的闪存单元中,将重编程目标重编程得到的作为额外空间作为预留空间;若不满足阈值判断条件,则将TLC类型的闪存单元作为预留空间。本发明能够在保证存储空间的同时保留较大的预留空间,提供稳定高速的读写性能。

    加速分布式图神经网络训练的方法及装置

    公开(公告)号:CN117574987A

    公开(公告)日:2024-02-20

    申请号:CN202311635371.2

    申请日:2023-12-01

    Applicant: 厦门大学

    Abstract: 本公开提供了一种加速分布式图神经网络训练的方法、电子设备及可读存储介质。本公开的加速分布式图神经网络训练的方法,包括:将图数据分割成n个子图G1,…,Gi,…,Gn;在第一周期,抽取子图Gi的内部节点及其节点特征,得到压缩子图Gi',从第二周期开始,对上一周期得到的第一压缩子图的节点特征进行优化,得到本周期的优化压缩子图Gi”;根据本周期的第一压缩子图的节点特征,得到本周期的第一压缩子图的节点之间的边预测;对于子图Gj,根据子图Gi、本周期的第二压缩子图和本周期的第二压缩子图的节点之间的边预测进行训练,得到第一梯度;通过同步所有子图的第一梯度,更新第一训练参数。

    基于调用图的依赖冲突修复方法及装置

    公开(公告)号:CN115016840A

    公开(公告)日:2022-09-06

    申请号:CN202210768989.5

    申请日:2022-06-30

    Applicant: 厦门大学

    Inventor: 吴荣鑫 王超 林立

    Abstract: 本公开提供一种基于调用图的依赖冲突修复方法,包括:输入Python项目路径和依赖冲突的包,经过调用图生成器处理后得到第一集合,第一集合包含项目调用到冲突包的所有方法;输入依赖冲突的包的所有版本,经过调用图生成器处理后得到第二集合,第二集合包含冲突包的其他版本包含的所有方法;将第一集合与第二集合进行比较,如果第一集合是第二集合的子集,获取依赖冲突的包的可替代版本,输出可替代版本列表。本公开还提供一种基于调用图的依赖冲突修复装置、电子设备以及可读存储介质。

Patent Agency Ranking