一种对角矩阵SPMV在GPU上的实现方法、电子设备及介质

    公开(公告)号:CN116595303A

    公开(公告)日:2023-08-15

    申请号:CN202310576069.8

    申请日:2023-05-19

    Abstract: 本发明属于船舶海上航行模拟领域,具体涉及一种对角矩阵SPMV在GPU上的实现方法、电子设备及介质。输入船舶海上航行模拟矩阵的数据文件,读取其数据并转化为COO存储方法;基于固定阈值的矩阵划分策略,将矩阵划分为若干不相交的行段,对行段信息进行有效存储;利用矩阵重构策略,对划分的行段进行重新排序归并,将归并结果进行压缩存储;将压缩存储的相关数据数组从主机端传递到设备端,按照一个线程块处理一个子块,一个线程处理一行的方式进行GPU并行SPMV运算;最后将线程运算结果从设备端传输到主机端,在主机端创建结果数组对运算结果进行整合存储。本发明用以缩短船舶海上航行模拟中GPU并行SPMV运算的时间,提高运算的效率和性能。

    一种基于空间和时序双通道融合模型的人体行为识别方法

    公开(公告)号:CN116580453A

    公开(公告)日:2023-08-11

    申请号:CN202310463831.1

    申请日:2023-04-26

    Abstract: 本发明公开了一种基于空间和时序双通道融合模型的人体行为识别方法,构建融合ER3D模型和Space‑TimeTransformer模型的深度学习网络架构,并通过对公开人体行为识别数据集进行端到端的预训练,得到初始化网络,接着读取人体行为训练视频,对训练视频做固定间隔采样和数据增强,将数据增强后的视频帧送入经过预训练的网络架构进行训练,生成人体行为识别模型。在测试阶段,读取测试集中的人体行为视频,对其进行采样和裁剪后送入训练好的识别模型进行识别,整个过程实现端到端的检测视频中的人体行为。本发明根据ER3D模型和Space‑TimeTransformer模型可以分别对视频帧中包含的空间信息和时序信息有效建模的特点,从而构建并训练出一种可以准确识别人体行为的深度学习网络架构。

Patent Agency Ranking