-
公开(公告)号:CN119847762A
公开(公告)日:2025-04-18
申请号:CN202510314404.6
申请日:2025-03-17
Applicant: 之江实验室
Abstract: 本说明书公开了一种基于数据并行的作业调度系统及方法。在本说明书提供的作业调度系统中,包括任务处理模块和高效能计算模块;所述任务处理模块,用于接收用户投递的大规模计算任务,确定与所述大规模计算任务对应的任务结构,根据所述任务结构对所述大规模计算任务进行拆分并构建若干计算作业;将所述计算作业发送给所述高效能计算模块;所述高效能计算模块,用于接收并处理所述任务处理模块发送的计算作业,所述的高效能计算模块包含若干计算集群模块。
-
公开(公告)号:CN117112145B
公开(公告)日:2024-02-13
申请号:CN202311336127.6
申请日:2023-10-16
Applicant: 之江实验室
IPC: G06F9/455 , G06F18/214 , G06N3/0464 , G06N3/08
Abstract: 本申请涉及一种训练模型分配方法、装置、计算机设备和存储介质。所述方法包括:获取待训练模型的模型信息和训练数据集;将训练模型根据层级信息划分为至少两个子模型,并将各子模型分配至训练集群中各机器节点;将各子模型根据计算参数信息划分为至少两个子模型切片,并将各子模型切片分配至训练集群中各机器节点的各计算处理器;将训练数据集根据计算参数信息划分为至少两个训练子数据集,并将各训练子数据集分配至训练集群中各计算处理器;根据训练集群中所有计算处理器,以及所有计算处理器对应的子模型切片和训练数据子集,对待训练模型进行训练。采用本申请的方法能够提高模型训练效率。
-
公开(公告)号:CN117075930A
公开(公告)日:2023-11-17
申请号:CN202311344160.3
申请日:2023-10-17
Applicant: 之江实验室
Abstract: 本说明书公开了一种计算框架管理系统。所述计算框架管理系统包括:计算框架安装模块、计算框架管理模块、交互模块、调度模块,可以根据用户的需求为用户提供用户所需的交互方式与用户进行交互,使得用户不需要学习与计算框架及其依赖的计算集群的使用方式,仅通过计算框架管理系统对不同的计算框架进行安装、配置以及使用,并可以通过计算框架管理系统自动监控计算集群和计算任务的执行状态,并自动处置存在异常的计算任务,进而可以在提升用户的体验同时,有效地在异构计算集群上对计算框架进行管理。
-
公开(公告)号:CN116151137B
公开(公告)日:2023-07-28
申请号:CN202310448224.8
申请日:2023-04-24
Applicant: 之江实验室
IPC: G06F30/27 , G06F9/50 , G06F9/455 , G06F9/48 , G06F111/10 , G06F111/08
Abstract: 本说明书公开了一种仿真系统、方法及装置,仿真系统为分布式系统,其中包括任务分割单元、调度单元和工作节点,仿真系统用于确定业务系统在指定业务策略下执行模拟业务的模拟结果。其中,由任务分割单元生成仿真任务,将仿真任务分割为多个子任务,调度单元向各工作节点分配各子任务,并确定各工作节点的实时负载,从而基于实时负载对已分配的各任务进行重新分配,工作节点执行分配的子任务得到任务执行结果,由调度单元根据各工作节点的任务执行结果确定模拟结果。由于仿真系统是分布式系统,可以基于多个工作节点的算力资源,满足业务系统执行模拟业务的资源需求,提高业务系统执行模拟业务的效率,并提升业务策略的优化效率。
-
公开(公告)号:CN116151137A
公开(公告)日:2023-05-23
申请号:CN202310448224.8
申请日:2023-04-24
Applicant: 之江实验室
IPC: G06F30/27 , G06F9/50 , G06F9/455 , G06F9/48 , G06F111/10 , G06F111/08
Abstract: 本说明书公开了一种仿真系统、方法及装置,仿真系统为分布式系统,其中包括任务分割单元、调度单元和工作节点,仿真系统用于确定业务系统在指定业务策略下执行模拟业务的模拟结果。其中,由任务分割单元生成仿真任务,将仿真任务分割为多个子任务,调度单元向各工作节点分配各子任务,并确定各工作节点的实时负载,从而基于实时负载对已分配的各任务进行重新分配,工作节点执行分配的子任务得到任务执行结果,由调度单元根据各工作节点的任务执行结果确定模拟结果。由于仿真系统是分布式系统,可以基于多个工作节点的算力资源,满足业务系统执行模拟业务的资源需求,提高业务系统执行模拟业务的效率,并提升业务策略的优化效率。
-
公开(公告)号:CN116150380A
公开(公告)日:2023-05-23
申请号:CN202310413634.9
申请日:2023-04-18
Applicant: 之江实验室
IPC: G06F16/35 , G06F18/22 , G06N3/0455 , G06N3/0895
Abstract: 本说明书公开了一种文本匹配方法、装置、存储介质及设备,根据匹配的文本对中各原始文本的表征向量的第一相似度、该文本对中各原始文本与各自变形文本的表征向量间的第二相似度及各原始文本与其他原始文本的表征向量的第三相似度,确定该文本对的损失。该第一相似度与第二相似度皆与该文本对的损失负相关,第三相似度与该文本对的损失正相关。在根据各文本对的损失确定总损失,并以总损失最小为目标训练得到训练后的表征模型后,则可响应于匹配请求,通过训练后的表征模型确定待匹配文本对的表征向量,以根据得到的表征向量确定待匹配文本对的匹配结果。可训练得到可输出准确表征向量的表征模型,提升基于表征模型进行文本匹配的匹配准确度。
-
公开(公告)号:CN115080749A
公开(公告)日:2022-09-20
申请号:CN202210980845.6
申请日:2022-08-16
Applicant: 之江实验室
IPC: G06F16/35 , G06F40/205 , G06F40/242 , G06K9/62
Abstract: 本发明公开了一种基于自监督训练的弱监督文本分类方法、系统和装置,包括如下步骤:S1:获取待标注文本数据和对应的类别标签集合;S2:获取预训练模型;S3:将预训练模型部分权重迁移至文本分类模型;S4:通过自监督伪标策略获得文本分类伪标签;本发明提供了一种基于自监督训练的弱监督文本分类方法,更贴近于文本分类实际应用场景,用户只需提供待标注数据和类别标签集合即可,极大地减少了文本数据标注成本。目前已有较多科技巨头公司开源了各种预训练自然语言模型,这些模型已提前学习到了海量信息中的通识知识,保证了分类精度。通过采用迁移学习方法和自监督训练策略,进一步提高了分类效率和精度。
-
公开(公告)号:CN114647732A
公开(公告)日:2022-06-21
申请号:CN202210559452.8
申请日:2022-05-23
Applicant: 之江实验室
IPC: G06F16/35
Abstract: 本发明公开了一种面向弱监督文本分类系统、方法和装置,包括以下模块:获取模块:从数据库中获取用户上传的待标注文本数据和提供的类别标签集合;文本分类模块:根据获取模块中用户上传的待标注文本数据,确定预训练自然语言模型,使用确定模型对待标注文本数据进行分类输出标注结果;文本标注模块:根据文本分类模块输出的标注结果,生成与待标注文本数据相对应的标注结果,从而完成对所述待标注文本数据的标注,本发明提供了一种面向弱监督文本分类系统,为解决文本分类问题提供一种新的解决思路,即用户只需提供待标注文本数据和类别标签集合,便可实现高准确率的标注结果,极大地减少了文本数据标注成本。
-
公开(公告)号:CN113191385B
公开(公告)日:2022-06-03
申请号:CN202110318366.3
申请日:2021-03-25
Applicant: 之江实验室
IPC: G06V10/774 , G06V10/762 , G06V10/764 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于预训练标注数据不可知的图像分类自动标注方法,包括如下步骤:S1,获取待标注图像,收集预训练图像分类模型;S2,将预训练图像分类模型拆分成特征提取模型与标签预测模型,并初始化,固定标签预测模型参数,不参与后续迁移训练;S3,约束特征提取模型,使自动标注模型的输出具体类别确定,整体分布离散;S4,对特征提取模型输出特征进行聚类;S5,筛选出大小超过阈值的聚类簇,所对应的类别组成为待标注图像标签空间;S6,给所有待标注图像打上伪标签;S7,重新聚类并分配伪标签,对特征提取模型进行有监督训练;S8,迭代S3至S7;S9,使用迁移后的自动标注模型对待标注图像进行推理,得到标注结果。
-
公开(公告)号:CN114494981A
公开(公告)日:2022-05-13
申请号:CN202210357179.0
申请日:2022-04-07
Applicant: 之江实验室
Abstract: 本发明公开了一种基于多层次运动建模的动作视频分类方法及系统,对段内和段间的运动信息进行多层次综合建模,其包含两个神经网络分支:段间分支对各视频段中采样得到的视频帧进行处理,用于提取前景目标的表观信息和段间运动信息;段内分支对各视频段中相邻视频帧的差值进行处理,用于提取前景目标的段内运动信息。段内分支所提取的帧差特征被用来对段间分支特征进行按通道加权,最后两个分支的卷积特征融合起来并共同输入到分类器中进行视频分类。本发明实现方法简便,手段灵活,在动作视频数据集上取得了显著的分类效果提升。
-
-
-
-
-
-
-
-
-