-
公开(公告)号:CN117037913B
公开(公告)日:2024-01-26
申请号:CN202311285979.7
申请日:2023-10-07
Applicant: 之江实验室
Abstract: 本说明书公开了一种蛋白质多序列比对方法、装置、存储介质及电子设备。所述蛋白质多序列比对方法包括:获取待比对蛋白质序列的特征表示,并将待比对蛋白质序列的特征表示拆分为指定数量的子特征表示,针对每个子特征表示,确定该子特征表示和预先确定的各聚类中心特征表示中与该子特征表示相对应的每个各聚类中心特征表示之间的相似度,并根据相似度确定每个子特征表示对应的目标聚类中心,从各基础蛋白质序列中确定出与目标聚类中心相匹配的各基础蛋白质序列,作为各候选蛋白质序列,将待比对蛋白质序列与每个候选蛋白质序列进行比对,得到与待比对蛋白质相匹配的目标蛋白质序列,并根据待比对蛋白质和目标蛋白质序列进行任务执行。
-
公开(公告)号:CN117112145A
公开(公告)日:2023-11-24
申请号:CN202311336127.6
申请日:2023-10-16
Applicant: 之江实验室
IPC: G06F9/455 , G06F18/214 , G06N3/0464 , G06N3/08
Abstract: 本申请涉及一种训练模型分配方法、装置、计算机设备和存储介质。所述方法包括:获取待训练模型的模型信息和训练数据集;将训练模型根据层级信息划分为至少两个子模型,并将各子模型分配至训练集群中各机器节点;将各子模型根据计算参数信息划分为至少两个子模型切片,并将各子模型切片分配至训练集群中各机器节点的各计算处理器;将训练数据集根据计算参数信息划分为至少两个训练子数据集,并将各训练子数据集分配至训练集群中各计算处理器;根据训练集群中所有计算处理器,以及所有计算处理器对应的子模型切片和训练数据子集,对待训练模型进行训练。采用本申请的方法能够提高模型训练效率。
-
公开(公告)号:CN116991246A
公开(公告)日:2023-11-03
申请号:CN202311256743.0
申请日:2023-09-27
Applicant: 之江实验室
Abstract: 本申请涉及导览机器人领域,特别是涉及一种用于导览机器人的算法调度方法、装置及导览机器人系统。所述方法包括:按照预设周期监测各所述处理器的运行参数;基于所述各所述处理器的运行参数,确定其中是否存在待算法调度的处理器以及接收算法调度的处理器;若存在待算法调度的处理器以及接收算法调度的处理器,则基于所述待算法调度的处理器所执行的算法或待恢复的算法的优先级,将对应的算法调度至所述接收算法调度的处理器。本发明使得导览机器人做到高效实时的智能交互,达到最优的用户体验。
-
公开(公告)号:CN115908955B
公开(公告)日:2023-06-20
申请号:CN202310202396.7
申请日:2023-03-06
Applicant: 之江实验室
IPC: G06V10/764 , G06V10/774 , G06V10/778 , G06V40/10
Abstract: 本发明公开了基于梯度蒸馏的少样本学习的鸟类分类系统、方法与装置,通过构建鸟类图像分类数据集;在训练阶段,从鸟类图像分类数据集抽取支撑集s和预测集q,经教师网络后,分别输出的特征向量进行匹配,得到预测集q的类别预测结果,并利用所述预测结果与预测集q的类别真值构建教师网络交叉熵损失函数,训练教师网络;获取鸟类图像经过教师网络、学生网络各个网络层的特征,并利用各层特征的和,作为损失值反向传播,得到输入的鸟类图像基于损失值的梯度信息,构建梯度损失函数,使教师网络和学生网络输入的鸟类图像的梯度信息相匹配;梯度损失函数叠加学生网络交叉熵损失函数,训练学生网络,用于鸟类图像分类。
-
公开(公告)号:CN116153389A
公开(公告)日:2023-05-23
申请号:CN202310431440.1
申请日:2023-04-21
Applicant: 之江实验室
Abstract: 本申请涉及人工智能领域,特别是涉及一种蛋白质语言模型的量化方法、装置、设备和存储介质,所述方法包括:采用均匀对称量化方法对蛋白质语言模型的权重值进行量化;通过校准数据集确定所述蛋白质语言模型的激活值的第一截断范围,并将所述第一截断范围划分为多个量化区间;通过分段线性量化方法分别对所述多个量化区间的激活值进行量化;基于量化后的权重值以及量化后的激活值,配置得到量化后的蛋白质语言模型。本发明提出的量化方法降低了模型量化的精度损失,在保证量化后模型预测精度的同时,减少模型的内存占用,提升模型推理速度。
-
公开(公告)号:CN115080750B
公开(公告)日:2022-11-08
申请号:CN202210980846.0
申请日:2022-08-16
Applicant: 之江实验室
IPC: G06F16/35 , G06F40/289 , G06K9/62
Abstract: 本发明公开了一种基于融合提示序列的弱监督文本分类方法、系统和装置,包括如下步骤:步骤1:获取待标注文本和类别标签集合;步骤2:对待标注文本增加提示序列,提示序列中引入占位符,所述占位符表示需后序处理以预测该位置单词;本发明基于更符合现实应用的弱监督文本分类场景,极大地减少了文本分类任务中人工的介入,降低了不可避免的人工误差,极大地节约了标注成本,提高了标注效率;在不获得任何标注信息的情况下,通过对文本数据进行有效的预处理,以及充分利用预训练模型输出特征,在不微调超大预训练模型的情况下,实现自动标注精度的大幅度提升。
-
公开(公告)号:CN115080749B
公开(公告)日:2022-11-08
申请号:CN202210980845.6
申请日:2022-08-16
Applicant: 之江实验室
IPC: G06F16/35 , G06F40/205 , G06F40/242 , G06K9/62
Abstract: 本发明公开了一种基于自监督训练的弱监督文本分类方法、系统和装置,包括如下步骤:S1:获取待标注文本数据和对应的类别标签集合;S2:获取预训练模型;S3:将预训练模型部分权重迁移至文本分类模型;S4:通过自监督伪标策略获得文本分类伪标签;本发明提供了一种基于自监督训练的弱监督文本分类方法,更贴近于文本分类实际应用场景,用户只需提供待标注数据和类别标签集合即可,极大地减少了文本数据标注成本。目前已有较多科技巨头公司开源了各种预训练自然语言模型,这些模型已提前学习到了海量信息中的通识知识,保证了分类精度。通过采用迁移学习方法和自监督训练策略,进一步提高了分类效率和精度。
-
公开(公告)号:CN115080748A
公开(公告)日:2022-09-20
申请号:CN202210980591.8
申请日:2022-08-16
Applicant: 之江实验室
IPC: G06F16/35 , G06F40/205
Abstract: 本发明公开了一种基于带噪标签学习的弱监督文本分类方法和装置,包括如下步骤:S1:获取待标注文本和类别标签集合;S2:确定预训练自然语言模型;S3:获得待标注文本伪标签;S4:初始化文本分类模型,基于伪标签计算分类损失函数;S5:通过带噪标签损失筛选方法得到高置信度数据:将所有待标注文本的分类损失函数按升序排列,筛选前top‑N数据作为高置信度数据;本发明提供了一种基于带噪标签学习的弱监督文本分类方法和装置,解决在仅获取待标注文本和类别标签集合情况下,实现高准确率分类结果,减少文本标注成本。
-
公开(公告)号:CN114419524B
公开(公告)日:2022-08-05
申请号:CN202210316304.3
申请日:2022-03-29
Applicant: 之江实验室
Abstract: 本发明公开了一种基于伪光流辅助的视频分类方法及系统,能够计算伪光流特征并利用其辅助进行视频分类,其中伪光流计算模块利用相关性计算/卷积/转置卷积等操作,无监督地估计伪光流特征,然后将其融合到主干网络中,从而对段间运动信息进行有效显式建模;伪光流激励模块则在将伪光流特征对通道维度取均值后,用来对主干网络中的视频卷积特征进行空间注意力操作,从而使得主干网络更关注与运动信息更相关的空间位置。本发明实现方法简便,思路灵活,在动作视频数据集上取得了显著的分类效果提升。
-
公开(公告)号:CN114708482A
公开(公告)日:2022-07-05
申请号:CN202210174254.X
申请日:2022-02-24
Abstract: 本发明公开了基于密度滤波和地标显著性的拓扑图场景识别方法及装置,有效解决视角变化下的场景识别问题,在目标检测算法的基础上,对得到的地标提取SIFT关键点,充分利用SIFT关键点对视角变化具有鲁棒性的特性,采用密度滤波算法获取具有视角不变性的地标,然后,通过对查询帧和参考帧中视角不变性地标的深度全局描述子进行交叉认证以及地标的形状分数的对比,得到两帧中相互匹配的地标,考虑到提取的地标仅仅代表图像的一小部分,一些低辨识度的地标可能会引起混淆,从而对匹配结果产生负面影响,因此使用地标定位网络获得地标显著性,然后利用基于地标间的空间关系、外观和图像显著性的拓扑图结构计算查询帧和参考帧匹配分数。
-
-
-
-
-
-
-
-
-