一种话题标签自动生成方法、装置及系统

    公开(公告)号:CN111191023B

    公开(公告)日:2022-07-26

    申请号:CN201911395888.2

    申请日:2019-12-30

    Abstract: 一种话题标签自动生成方法、装置与系统,包括:步骤一:构建训练数据集合与数据预处理;步骤二:实现基于内容片段的内容选择机制的Transformer encoder特征编码器;步骤三:Transformer decoder的话题摘要生成器模型;步骤四:训练数据并根据交叉验证调优,并实现模型封装与装置的接口实现;本发明通过文本摘要生成技术实现话题标签的自动生成,提出了一种话题标签生成的新场景,本发明提出内容选择机制的Transformer编码并抽取重要的源文本片段,输入解码器用于文本生成,这种设计即捕捉了有效的核心语义片段,又减少了模型训练的开销。

    基于触发词语态学习的金融文本事件抽取方法及装置

    公开(公告)号:CN113312916A

    公开(公告)日:2021-08-27

    申请号:CN202110589745.6

    申请日:2021-05-28

    Abstract: 本发明通过神经网络领域的方法,实现了基于触发词语态学习的金融文本事件抽取方法及装置。方法包括三个步骤:金融领域文本预训练、事件分类和基于触发词语态学习的金融文本事件要素抽取;金融领域文本预训练步骤的实现结合金融知识图谱构建BERT预训练模型,以输入词序列作为模型输入,结合神经网络方法,在已有的金融文本训练集和金融知识图谱数据上进行再训练,得到适合下游事件分类和事件抽取的词表征和实体表征,而后通过词表征做多标签多分类任务得到事件检测结果,最后每一个输入词对应的词表征作为多标签分类任务的表征向量进行计算得到输出结果,从而形成一个能够自动精准抽取金融文本事件的方法。

    一种基于对话状态追踪技术的事件抽取方法

    公开(公告)号:CN113312464A

    公开(公告)日:2021-08-27

    申请号:CN202110589755.X

    申请日:2021-05-28

    Abstract: 本发明通过人工智能领域的方法,实现了一种基于对话状态追踪技术的事件抽取方法。方法整体由事件分类、序列问题生成模型和论元抽取模型三部分组成;事件分类检测输入文本是否是事件,如果文本不包含事件,则输出NULL,否则分类文本所属的事件类型;序列问题生成模型根据事件类型和已经预测的置信度高的论元结果自动生成问题;论元抽取模型将所述序列问题生成模型生成的问题和输入文本作为输入来预测论元位置,然后采用标签对齐机制将预测的论元中置信度高的论元加入训练集中。这一方法通过三部分模型,能对所有参数的预测结果和高置信度结果进行反馈;提取两个任务之间的共同信息和模式,并利用所学习到的语法和语义知识标记;并充分利用论元之间的相关性。

    基于实体序列编码的知识图谱融合方法

    公开(公告)号:CN111191471B

    公开(公告)日:2022-06-28

    申请号:CN201911393679.4

    申请日:2019-12-30

    Abstract: 本发明公开了基于实体序列编码的知识图谱融合方法,所述方法包括:步骤一:知识图谱实体表示学习;步骤二:选择路径编码和对齐模型;步骤三:跨语言实体对齐模型,其中,在源语言知识图谱空间中,针对其中的一个实体,构建与其他种子实体的2跳序列,在目标语言知识图谱空间中构建可能与之对应的序列,找出概率最高的对齐序列,然后从对齐序列中找到同位置的节点,作为该节点的对齐节点;步骤四:添加新的候选种子节点;本发明针对现有技术中深度学习模型训练语料不足的问题,提出了基于实体路径表示学习的方法。

    一种基于对话状态追踪技术的事件抽取方法

    公开(公告)号:CN113312464B

    公开(公告)日:2022-05-31

    申请号:CN202110589755.X

    申请日:2021-05-28

    Abstract: 本发明通过人工智能领域的方法,实现了一种基于对话状态追踪技术的事件抽取方法。方法整体由事件分类、序列问题生成模型和论元抽取模型三部分组成;事件分类检测输入文本是否是事件,如果文本不包含事件,则输出NULL,否则分类文本所属的事件类型;序列问题生成模型根据事件类型和已经预测的置信度高的论元结果自动生成问题;论元抽取模型将所述序列问题生成模型生成的问题和输入文本作为输入来预测论元位置,然后采用标签对齐机制将预测的论元中置信度高的论元加入训练集中。这一方法通过三部分模型,能对所有参数的预测结果和高置信度结果进行反馈;提取两个任务之间的共同信息和模式,并利用所学习到的语法和语义知识标记;并充分利用论元之间的相关性。

    一种基于链路预测实现跨语言知识空间实体对齐方法及系统

    公开(公告)号:CN111191462A

    公开(公告)日:2020-05-22

    申请号:CN201911396048.8

    申请日:2019-12-30

    Abstract: 本发明涉及一种基于链路预测实现跨语言知识空间实体对齐方法和系统,其通过跨语言知识空间三元组融合、知识空间表示学习、预测新对齐实体对、自学习添加新的训练数据四个步骤生成经过预测的实体对,针对少量的训练语料,设计简单基于链路预测的方法预测新的实体对,进行跨语言知识空间融合,在此基础上提高两个知识空间中数据融合中,判断跨语言知识空间的实体对是否是同一个实体的效率,方法模型的设计较为轻便,且其节约了标注的人力。

    一种多任务学习的商品评论标签自动生成方法、装置及系统

    公开(公告)号:CN111325571B

    公开(公告)日:2023-08-18

    申请号:CN201911396009.8

    申请日:2019-12-30

    Abstract: 一种多任务学习的商品评论标签自动生成方法、装置与系统,包括:步骤一:构建训练数据集合与数据预处理;步骤二:实现基于Transformer encoder的评论源文本特征编码器;步骤三:提取代表评论源文本整体内容的[cls]标签对于的隐状态向量用于情感分类任务;步骤四:基于Transformer decoder实现多任务的评论摘要生成器模型;步骤五:训练数据并根据联合loss函数进行训练调优,并实现模型封装与装置的接口实现;本发明避免采用抽取式的方式去生成评论标签,即不需要依赖句法结构的人工的规则集不能适合多个领域场景的缺点,又能保证标签生成的高效性,即只需要输入源文本,本发明装置能够自动产生标签。

Patent Agency Ranking