一种参数粒度自适应调频的联邦学习方法及系统

    公开(公告)号:CN118607618A

    公开(公告)日:2024-09-06

    申请号:CN202410782352.0

    申请日:2024-06-18

    Abstract: 本发明提供参数粒度自适应调频的联邦学习方法及系统,包括:服务器选择每轮参与训练的客户端,将每个参数同步频率的更新信息传输到被选择的客户端;客户端的模型训练进程从通讯守护进程接收聚合的参数,根据每个参数的同步频率进行同步训练;通讯守护进程接收完成训练的参数,与服务器通讯进行聚合,再从服务器接收聚合后的参数并在下一轮训练时返回给模型训练进程;在聚合时,服务端计算梯度冲突率,当某个参数的梯度冲突率小于阈值时,将该参数的同步频率增倍,在下一轮训练时传输需要更新频率的参数的位置到所有的客户端中。本发明采用参数粒度的调频方式,对每个参数进行更准确的频率设置,保证训练效率的同时,提高最终模型的收敛准确率。

    基于现场可编程逻辑门阵列的多层中间表示的编译方法

    公开(公告)号:CN118689486A

    公开(公告)日:2024-09-24

    申请号:CN202410731720.9

    申请日:2024-06-06

    Abstract: 本发明公开了基于现场可编程逻辑门阵列的多层中间表示的编译方法,该方法包括:接收用户输入的算法,并通过编译器的编译流程,将该输入算法划分为三层不同抽象层次的中间表示,包括依赖图中间表示、多面体中间表示和带有硬件描述语言HLS原语属性的MLIR仿射方言中间表示;实施自动设计空间探索DSE;将优化后的MLIR仿射方言中间表示发送至编译器后端,生成可综合的HLS C代码,其中所有的HLS属性均转换为对应的HLS原语,以供FPGA加速器使用。该方法旨在解决现有编译框架在FPGA编程中的不足,通过引入多层中间表示技术,实现了编译过程的优化和简化,从而降低了FPGA编程的难度。

    支持动态和静态稀疏注意力机制的硬件加速器

    公开(公告)号:CN117744728A

    公开(公告)日:2024-03-22

    申请号:CN202311750689.5

    申请日:2023-12-19

    Abstract: 一种支持动态稀疏和静态稀疏硬件加速器,包括:数据切分和重排序模块,用于对输入的数据进行切分,以适应空间加速器硬件大小;空间加速器模块,用于支持稀疏注意力机制的运算;权重加和模块,用以支持混合注意力模式的切分,将分块的输入数据计算得到的结果进行合并,得到最终的输出;模式匹配模块包括矩阵乘法运算模块,双调排序器和滑动窗口比较器,用于进行混合注意力模式匹配。本发明同时支持静态稀疏方法和动态稀疏方法,可以进行高效的静态和动态稀疏注意力计算。节省了至少6.1倍的计算量,同时保持输出结果的准确性。

Patent Agency Ranking