-
公开(公告)号:CN115080748A
公开(公告)日:2022-09-20
申请号:CN202210980591.8
申请日:2022-08-16
Applicant: 之江实验室
IPC: G06F16/35 , G06F40/205
Abstract: 本发明公开了一种基于带噪标签学习的弱监督文本分类方法和装置,包括如下步骤:S1:获取待标注文本和类别标签集合;S2:确定预训练自然语言模型;S3:获得待标注文本伪标签;S4:初始化文本分类模型,基于伪标签计算分类损失函数;S5:通过带噪标签损失筛选方法得到高置信度数据:将所有待标注文本的分类损失函数按升序排列,筛选前top‑N数据作为高置信度数据;本发明提供了一种基于带噪标签学习的弱监督文本分类方法和装置,解决在仅获取待标注文本和类别标签集合情况下,实现高准确率分类结果,减少文本标注成本。
-
公开(公告)号:CN112381215A
公开(公告)日:2021-02-19
申请号:CN202011493383.2
申请日:2020-12-17
Applicant: 之江实验室
Abstract: 本发明公开了一种面向自动机器学习的自适应搜索空间生成方法与装置,该方法包括如下步骤:步骤一、全量收集计算机视觉领域的各类任务,形成视觉任务集合;步骤二、定义不同层次元模块,形成初始元模块搜索空间;步骤三、根据视觉任务集合和元模块集合形成视觉任务和元模块矩阵,通过概率统计计算,生成关联概率分布,用于计算目标视觉任务与已有视觉任务的相似度;步骤四、根据相似度,选取与目标视觉任务相关的视觉任务的搜索空间中的元模块,并生成面向相关视觉任务的子搜索空间;步骤五、更新视觉任务集合和元模块集合。本发明对任务与元模块图谱引入动态更新的反馈机制,有利于图谱的不断优化并增强了图谱对于其他任务的适用性。
-
公开(公告)号:CN112381215B
公开(公告)日:2023-08-11
申请号:CN202011493383.2
申请日:2020-12-17
Applicant: 之江实验室
IPC: G06N3/0464 , G06N3/048 , G06N3/08 , G06N20/00 , G06V10/764 , G06V10/82
Abstract: 本发明公开了一种面向自动机器学习的自适应搜索空间生成方法与装置,该方法包括如下步骤:步骤一、全量收集计算机视觉领域的各类任务,形成视觉任务集合;步骤二、定义不同层次元模块,形成初始元模块搜索空间;步骤三、根据视觉任务集合和元模块集合形成视觉任务和元模块矩阵,通过概率统计计算,生成关联概率分布,用于计算目标视觉任务与已有视觉任务的相似度;步骤四、根据相似度,选取与目标视觉任务相关的视觉任务的搜索空间中的元模块,并生成面向相关视觉任务的子搜索空间;步骤五、更新视觉任务集合和元模块集合。本发明对任务与元模块图谱引入动态更新的反馈机制,有利于图谱的不断优化并增强了图谱对于其他任务的适用性。
-
公开(公告)号:CN115080750A
公开(公告)日:2022-09-20
申请号:CN202210980846.0
申请日:2022-08-16
Applicant: 之江实验室
IPC: G06F16/35 , G06F40/289 , G06K9/62
Abstract: 本发明公开了一种基于融合提示序列的弱监督文本分类方法、系统和装置,包括如下步骤:步骤1:获取待标注文本和类别标签集合;步骤2:对待标注文本增加提示序列,提示序列中引入占位符,所述占位符表示需后序处理以预测该位置单词;本发明基于更符合现实应用的弱监督文本分类场景,极大地减少了文本分类任务中人工的介入,降低了不可避免的人工误差,极大地节约了标注成本,提高了标注效率;在不获得任何标注信息的情况下,通过对文本数据进行有效的预处理,以及充分利用预训练模型输出特征,在不微调超大预训练模型的情况下,实现自动标注精度的大幅度提升。
-
公开(公告)号:CN113836386A
公开(公告)日:2021-12-24
申请号:CN202111410689.1
申请日:2021-11-25
Applicant: 之江实验室
IPC: G06F16/953 , G06F21/64 , H04L9/32
Abstract: 本发明提供了一种并行模式搜索空间构造系统和方法,该方法为:初始化输入逻辑张量;计算并输出逻辑张量真值;构造所有候选并行模式,确定输入和输出张量并行模式迭代内容;结合输入张量并行模式迭代内容,切分输入逻辑张量为物理张量;判断物理张量计算合法性,若合法,计算物理张量结果并输出;若非法,继续输入张量并行模式迭代过程;结合输出张量并行模式迭代内容,合并物理张量运算结果为逻辑张量;对比逻辑张量真值和逻辑张量,若相等,将该并行模式添加到合法并行模式搜索空间中,并直接继续输入张量并行模式迭代过程;若不相等,继续输出张量并行模式迭代过程,直到迭代完成后,重复所述以上步骤,直到所述输入张量并行模式迭代过程完成。
-
公开(公告)号:CN115080748B
公开(公告)日:2022-11-11
申请号:CN202210980591.8
申请日:2022-08-16
Applicant: 之江实验室
IPC: G06F16/35 , G06F40/205
Abstract: 本发明公开了一种基于带噪标签学习的弱监督文本分类方法和装置,包括如下步骤:S1:获取待标注文本和类别标签集合;S2:确定预训练自然语言模型;S3:获得待标注文本伪标签;S4:初始化文本分类模型,基于伪标签计算分类损失函数;S5:通过带噪标签损失筛选方法得到高置信度数据:将所有待标注文本的分类损失函数按升序排列,筛选前top‑N数据作为高置信度数据;本发明提供了一种基于带噪标签学习的弱监督文本分类方法和装置,解决在仅获取待标注文本和类别标签集合情况下,实现高准确率分类结果,减少文本标注成本。
-
公开(公告)号:CN113128565B
公开(公告)日:2022-05-06
申请号:CN202110317531.3
申请日:2021-03-25
Applicant: 之江实验室
IPC: G06V10/774 , G06V10/762 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本发明公开了面向预训练标注数据不可知的图像自动标注系统,包括:获取模块和图像标注模块,及分别与所述获取模块和图像标注模块连接的模型迁移模块;所述获取模块,用于获取一组图像标注任务和待标注图像;所述模型迁移模块,用于将一组确定的预训练图像处理模型无监督迁移至适配于待标注图像域的更新后的图像处理模型,包括依次连接的模型拆分单元、信息最大化损失约束单元、聚类单元、标签空间分类单元、标签分配单元、分配更新单元和收敛单元;所述图像标注模块,用于生成与待标注图像相匹配的标注信息,并进行可视化标注。
-
-
-
-
-
-