一种可利用专家知识的申请书多标签层次分类方法

    公开(公告)号:CN113761197B

    公开(公告)日:2022-07-26

    申请号:CN202110866392.X

    申请日:2021-07-29

    Abstract: 本发明公开了一种可利用专家知识的申请书多标签层次分类方法,其步骤包括:1)对于申请书中的各类别文本数据,分别抽取每一所述文本数据中各类别的文本信息;对每一所述文本数据进行编码后添加对应的类别编码并发送给词等级的编码器,得到表征向量;2)将每一文本数据对应的表征向量输入文档等级的编码器,得到申请书的表征向量;3)利用申请书的表征向量与初始化的预测信息,预测申请书在学科体系的第n层级的标签;4)基于申请书在学科体系的第n层级的预测标签和申请书的表征向量,预测申请书在学科体系的第n+1层级的标签;5)如果当前层级为学科体系的最后层级则完成预测,得到最细粒度标签;否则返回步骤4),进行下一层级预测。

    一种可利用专家知识的申请书多标签层次分类方法

    公开(公告)号:CN113761197A

    公开(公告)日:2021-12-07

    申请号:CN202110866392.X

    申请日:2021-07-29

    Abstract: 本发明公开了一种可利用专家知识的申请书多标签层次分类方法,其步骤包括:1)对于申请书中的各类别文本数据,分别抽取每一所述文本数据中各类别的文本信息;对每一所述文本数据进行编码后添加对应的类别编码并发送给词等级的编码器,得到表征向量;2)将每一文本数据对应的表征向量输入文档等级的编码器,得到申请书的表征向量;3)利用申请书的表征向量与初始化的预测信息,预测申请书在学科体系的第n层级的标签;4)基于申请书在学科体系的第n层级的预测标签和申请书的表征向量,预测申请书在学科体系的第n+1层级的标签;5)如果当前层级为学科体系的最后层级则完成预测,得到最细粒度标签;否则返回步骤4),进行下一层级预测。

    针对单细胞RNA测序数据的关键基因定位方法及装置

    公开(公告)号:CN118351941A

    公开(公告)日:2024-07-16

    申请号:CN202410376805.X

    申请日:2024-03-29

    Abstract: 本发明公开了一种针对单细胞RNA测序数据的关键基因定位方法及装置,涉及机器学习和生物基因领域,本发明为每个基因特征分配一个智能体,将选择关键基因的先验知识存入智能体的内存中;令智能体根据基于先验知识进行环境知识探索,计算对应的当前状态、动作、奖励和下一状态并作为探索的环境知识存入智能体的内存中;对智能体进行行为策略提升,按照贝尔曼方程更新行为策略;使用智能体基于更新后的行为策略,对单细胞RNA测序数据集中的关键基因进行定位。本发明通过多智能体强化学习获取更佳的行为策略,提高对关键基因定位的质量,以及提升关键基因在下游任务上的表现,更好地揭示细胞群体中的异质性。

    一种基于超大规模语言模型的富语义标签数据增广方法

    公开(公告)号:CN117494760A

    公开(公告)日:2024-02-02

    申请号:CN202311320484.3

    申请日:2023-10-12

    Abstract: 本发明公开了一种基于超大规模语言模型的富语义标签数据增广方法。本方法为:1)从若干个数据集中获取学科文本数据,组成一学科数据库;遍历学科数据库中每一数据样本,将具有相同分类号的数据样本划分到层次学科结构采样树的同一节点中,根据分类号确定各节点的位置,构建出层次学科结构采样树并计算每一节点的统计信息;2)确定每一学科分类的增强样本数;3)根据每一学科分类的增强样本数更新层次学科结构采样树,并计算每一节点的统计信息;4)根据每一节点更新前后的统计信息,判断各学科分类对应的样本数量是否平衡,如果不平衡则重复步骤2~3);5)利用超大规模语言模型为每一学科分类生成相应数量的对应学科分类的数据样本。

Patent Agency Ranking