一种文本分类方法以及相关设备
    1.
    发明公开

    公开(公告)号:CN118394931A

    公开(公告)日:2024-07-26

    申请号:CN202310064093.3

    申请日:2023-01-19

    Abstract: 本申请公开了一种文本分类方法,该方法中,通过神经网络中的多个信息提取子网络,获得文本数据的多个尺度的文本特征,并通过每个信息提取子网络,获得多个预设类别标签中,每个预设类别标签与每个相应尺度的文本特征之间的相关性信息,从而根据每个信息提取子网络获得的相关性信息,获得文本数据的分类结果。这样,在确定该文本数据对应的目标类别之后,则可以根据每个信息提取子网络获得的相关性信息,从多个尺度的文本特征中确定出与该目标类别的相关性较高的文本特征,从而可以确定出文本数据中与该目标类别相关度较高的文本内容以作为该目标类别的推理依据,从而实现对文本数据的分类结果的解释,提升神经网络的推理结果的可解释性。

    一种数据处理方法及相关设备
    3.
    发明公开

    公开(公告)号:CN118467744A

    公开(公告)日:2024-08-09

    申请号:CN202310067484.0

    申请日:2023-02-02

    Abstract: 本申请实施例提供了一种数据处理方法,可以应用于知识图谱构建等场景。该方法包括:获取文本数据;基于采样矩阵确定文本数据中的多个片段;确定多个片段的多个实体信息,每个实体信息包括第一实体的实体边界信息以及第一实体的类型;基于多个实体信息生成文本数据的多个第二实体。通过采样矩阵确定文本数据的多个片段,并预测出片段的实体信息,进而基于实体信息生成文本数据的第二实体。实体识别过程细化为片段的实体预测与第二实体的生成,相较于整个文本数据的实体生成,可以实现更细粒度的实体生成。

    一种语言表征模型的训练方法以及训练装置

    公开(公告)号:CN116933789A

    公开(公告)日:2023-10-24

    申请号:CN202210318687.8

    申请日:2022-03-29

    Abstract: 本申请实施例公开了一种语言表征模型的训练方法以及训练装置,用于提升语言表征模型的模型精度。本申请实施例方法包括:获取第一语言数据,基于语言表征模型和第一语言数据进行多任务学习,得到目标损失函数,多任务学习包括掩码语言任务和关系分类任务,掩码语言任务用于根据语言表征模型生成的数据执行掩码语言任务,关系分类任务用于基于语言表征模型生成的数据执行关系分类任务。根据目标损失函数更新语言表征模型。

    一种数据处理方法及数据处理装置

    公开(公告)号:CN116205306A

    公开(公告)日:2023-06-02

    申请号:CN202111453147.2

    申请日:2021-11-30

    Abstract: 本申请实施例公开了一种数据处理方法以及数据处理装置,用于提升AI任务模型的预测准确率。本申请实施例方法包括:获取多种数据,多种数据中的各种数据具有不同的来源和不同的数据类型。对多种数据进行知识抽取,获得知识图谱,知识图谱包括多个知识实体以及多个知识实体之间的关联关系,多个知识实体包括不同的数据类型。利用与每个知识实体的数据类型对应的知识表征算法对每个知识实体进行知识表征,且对知识图谱中多个知识实体之间的关系进行权重的初始化,获得向量图,向量图用于训练人工智能AI任务模型。

Patent Agency Ranking