一种命名实体识别模型的训练方法及命名实体识别的方法

    公开(公告)号:CN111738004A

    公开(公告)日:2020-10-02

    申请号:CN202010546972.6

    申请日:2020-06-16

    Abstract: 本发明实施例提供了一种命名实体识别模型的训练方法及命名实体识别的方法,本发明利用训练集训练BERT-CRF模型得到经本轮训练的命名实体识别模型,然后用经本轮训练的命名实体识别模型标记待识别数据集得到弱标记的待识别数据集,从弱标记的待识别数据集中选择一部分与初始训练集合并作为新的训练数据集继续对命名实体识别模型进行下一轮训练,从而让命名实体识别模型在对待识别数据集进行识别前用待识别数据集对模型进行调整,使其具有更佳的泛化能力,最终提升模型在待识别数据集上的识别效果。

    一种基于熵的神经机器翻译动态解码方法及系统

    公开(公告)号:CN111428519A

    公开(公告)日:2020-07-17

    申请号:CN202010151246.4

    申请日:2020-03-06

    Abstract: 本发明提出一种基于熵的神经机器翻译动态解码方法及系统,通过分析句子的熵值与BLEU值之间的关系,发现BLEU值高的句子中单词的平均熵值比BLEU值低的句子中单词的平均熵值小,且熵值低的句子的BLEU值普遍比熵值高的句子的BLEU值高。通过计算句子的熵值与BLEU值之间的Pearson系数,发现两者之间存在相关性。因此,本发明提出在训练过程解码阶段的每个时间步,不仅要以一定的概率采样选择真实单词或预测单词获取上下文信息,还要根据上一个时间步的预测结果计算熵值,然后根据熵值动态调整上下文信息的权重。解决了神经机器翻译模型在解码过程中因训练和推断之间的上下文信息差异而导致的错误累积问题。

    一种用于显性代词的指代消解方法、系统

    公开(公告)号:CN119129592A

    公开(公告)日:2024-12-13

    申请号:CN202310691860.3

    申请日:2023-06-12

    Abstract: 本发明提供一种用于显性代词的指代消解方法,所述方法包括:S1、获取待处理文本段落并将其拆分为多个分句;S2、判断所述待处理文本段落是否存在指代现象,存在指代现象时,将存在照应语的分句作为一个当前文本,以及选择每一个当前文本相邻的前一个或多个分句作为其对应的历史文本,并对每一个当前文本及其对应的历史文本执行如下步骤:S21、获取当前文本中照应语的候选先行语集合;S22、将当前文本与其对应的历史文本进行拼接得到一个原始文本,并获取原始文本对应的替换文本集合;S23、采用预训练语言模型计算原始文本与其对应的所有替换文本之间的语义相似度;S24、基于所述步骤S23计算的语义相似度确定原始文本中照应语对应的指代对象。

    一种命名实体识别模型的训练方法及命名实体识别的方法

    公开(公告)号:CN111738004B

    公开(公告)日:2023-10-27

    申请号:CN202010546972.6

    申请日:2020-06-16

    Abstract: 本发明实施例提供了一种命名实体识别模型的训练方法及命名实体识别的方法,本发明利用训练集训练BERT‑CRF模型得到经本轮训练的命名实体识别模型,然后用经本轮训练的命名实体识别模型标记待识别数据集得到弱标记的待识别数据集,从弱标记的待识别数据集中选择一部分与初始训练集合并作为新的训练数据集继续对命名实体识别模型进行下一轮训练,从而让命名实体识别模型在对待识别数据集进行识别前用待识别数据集对模型进行调整,使其具有更佳的泛化能力,最终提升模型在待识别数据集上的识别效果。

    一种构建共指消解模型的方法、共指消解的方法和介质

    公开(公告)号:CN111967258B

    公开(公告)日:2023-07-21

    申请号:CN202010667443.1

    申请日:2020-07-13

    Abstract: 本发明实施例提供了一种构建共指消解模型的方法、共指消解的方法和介质,所述方法包括A1、构建初始共指消解模型,所述初始共指消解模型包括预训练模块、文段向量模块、指称词判断模块和共指判断模块,其中,所述预训练模块采用预训练的XLNet模型,所述指称词判断模块包括第一前馈网络,所述共指判断模块包括第二前馈网络;A2、获取包括多个句子的训练数据集,所述训练数据集带有人工标注的共指关系;A3、用所述训练数据集对初始共指消解模型进行多轮训练至其收敛获得共指消解模型。本发明实施例的技术方案可以提升共指消解过程对于长距离依赖的共指关系的判断性能。

    基于因果关系的序列到序列文本摘要生成方法及系统

    公开(公告)号:CN115658881A

    公开(公告)日:2023-01-31

    申请号:CN202211215316.3

    申请日:2022-09-30

    Abstract: 本发明提出一种基于因果关系的序列到序列文本摘要生成方法和系统,属于自然语言处理和自动文本摘要生成领域。本方法受到因果理论的启发,从数据生成的角度研究了摘要任务中各要素的因果关系。该方法首先引入两个不可观测变量,得出摘要任务的结构因果模型;然后根据结构因果模型得出相应的序列到序列生成框架,用于建模原文和摘要的生成过程。该框架包含三个核心模块:双隐变量变分编码器、原文重构解码器和摘要预测解码器。此方法不仅比现有的端到端深度文本摘要方法具备更强的可解释性,还具备更好的摘要性能和更强的泛化能力。该方法是一个具备强适用性的序列到序列框架,因此可以迁移到更多模型主体、生成任务和不同数据集上。

    一种基于类别稠密向量表示的通用文本分类方法及系统

    公开(公告)号:CN111259658B

    公开(公告)日:2022-08-19

    申请号:CN202010080710.5

    申请日:2020-02-05

    Abstract: 本发明提出一种基于类别稠密向量表示的通用文本分类方法及系统,包括:获取包括以标记类别文本的训练数据,使用全连接网络处理该训练数据,得到各类别的类别稠密向量;将待分类文本输入至深度神经网络,得到该待分类文本中每个词的词稠密向量,并集合该词稠密向量得到该待分类文本的文本稠密向量;将该文本稠密向量和该类别稠密向量输入至匹配度测量模型,得到该待分类文本属于各类别的概率分布,将该待分类文本与该概率分布中概率最大的类别相匹配,作为该待分类文本的分类结果。本发明基于类别稠密向量表示,将文本分类问题转化为文本匹配问题,通过计算输入文本与每个类别之间的匹配程度,将文本分到匹配程度最大的类别之中。

    基于知识图谱的搜索方法、装置、计算机设备及存储介质

    公开(公告)号:CN114637855A

    公开(公告)日:2022-06-17

    申请号:CN202210223234.7

    申请日:2022-03-09

    Abstract: 本申请公开了一种基于知识图谱的搜索方法、装置、计算机设备及存储介质,涉及信息检索技术领域。所述方法包括:在知识图谱中确定与查询文本对应的候选实体列表,候选实体列表包括至少一个候选实体;对查询文本进行编码得到第一查询向量,以及对候选实体的知识图谱信息进行编码得到第一候选向量;将第一查询向量和第一候选向量输入自注意力层,得到第二查询向量和第二候选向量;根据第二查询向量和第二候选向量的向量相似度,确定查询文本与候选实体的相关度打分;根据相关度打分对候选实体进行排序,以及基于排序结果输出搜索结果。本申请通过自注意力层实现查询文本和候选实体列表中的各个候选实体的交互,提升了搜索的精确度。

    一种开放域文本的实体关系抽取方法及系统

    公开(公告)号:CN114021566A

    公开(公告)日:2022-02-08

    申请号:CN202111268377.1

    申请日:2021-10-29

    Abstract: 本发明提出一种开放域文本的实体关系抽取方法和系统,包括:获取已标注的文本作为训练数据,实体识别抽取训练数据中所有命名实体和名词短语,并对其进行数据增强;以增强后的数据为输入,训练神经网络模型,得到实体关系分类模型;统计增强后的数据中各命名实体和名词短语出现的词频,并将词频大于预设值的命名实体和名词短语标记为过滤词汇;获取开放域文本及其对应的头实体,抽取开放域文本中除过滤词汇以外的命名实体和名词短语并输入实体关系分类模型,得到开放域文本的实体关系。通过有效的数据增强策略,无需增加额外的成本,有效解决由于候选尾实体带来的噪音问题导致的实体关系识别在实际应用中效果不佳的问题。

Patent Agency Ranking