一种中文摘要的生成及预警方法、系统、设备及介质

    公开(公告)号:CN115840814A

    公开(公告)日:2023-03-24

    申请号:CN202211110688.X

    申请日:2022-09-13

    Abstract: 本发明涉及一种中文摘要的生成及预警方法、系统、设备及介质,包括以下步骤:获取第一中文文本;将所述第一中文文本输入GPT‑2模型,通过所述GPT‑2模型,确定所述第一中文文本对应的第一摘要,以及所述第一摘要对应的第一类别,所述第一类别表征了所述第一摘要的主题;根据所述第一类别,确定预警信息,所述预警信息表征了所述第二摘要是否包含敏感信息。解决了GPT‑2模型生成的摘要通常表现不如人工总结的摘要质量高,并且摘要中会包含一些敏感信息的问题。

    一种文本摘要评价方法、装置以及存储介质

    公开(公告)号:CN115221863A

    公开(公告)日:2022-10-21

    申请号:CN202210844106.4

    申请日:2022-07-18

    Inventor: 蔡晓东 蒋鹏

    Abstract: 本发明提供一种文本摘要评价方法、装置以及存储介质,属于语言处理领域,方法包括:对原始中文文本进行预处理得到处理后文本;对所有的原始中文文本和所有的处理后文本进行摘要关键信息覆盖率的分析得到摘要关键信息覆盖率、原始文本摘要概率分布以及处理后文本摘要概率分布;对摘要关键信息覆盖率、原始文本摘要概率分布以及处理后文本摘要概率分布进行评价分数的计算得到文本摘要评价结果。本发明能够更加合理地评价生成摘要,且评价结果更加接近人工评价,从而使评价内容更灵活且合理。

    一种基于投影映射的句子语义匹配模型训练方法及系统

    公开(公告)号:CN117592484A

    公开(公告)日:2024-02-23

    申请号:CN202311606239.9

    申请日:2023-11-28

    Inventor: 蒋鹏 蔡晓东

    Abstract: 本发明提供一种基于投影映射的句子语义匹配模型训练方法及系统,涉及句子语义匹配技术领域;本发明通过将待匹配句子对输入句子语义匹配模型,通过语言模型GPT4对待匹配句子对进行特征提取,得到语义特征;通过特征聚合器的点乘注意力机制对语义特征进行计算,得到关键信息;通过特征蒸馏层的投影组件将语义特征投影到关键信息中,得到匹配信息;对匹配信息进行概率计算,得到匹配概率,通过损失函数对匹配概率进行计算,得到损失值;根据损失值对句子语义匹配模型进行优化,得到优化句子语义匹配模型。通过点乘注意力机制提取待匹配句子对的关键信息,以通过投影定理去除待匹配句子对中的冗余信息,以识别出句子最有效的信息特征。

    一种语义解析模型训练方法及系统

    公开(公告)号:CN117591545A

    公开(公告)日:2024-02-23

    申请号:CN202311600654.3

    申请日:2023-11-28

    Inventor: 蒋鹏 蔡晓东

    Abstract: 本发明涉及一种语义解析模型训练方法及系统,方法包括:获取待训练向量序列;将训练向量序列输入第一个保留层,并通过最后一个保留层输出每个词语的屏蔽标记对应的预测屏蔽标记;确定预设的表模式中每列数据与每个预测屏蔽标记之间的预测有向边和预测标签;确定每个预测屏蔽标记对应的每个第五损失值,若各个第五损失值均小于预设值,则将各个第五损失值均小于预设值对应的保留网络作为目标语义解析模型,若各个第五损失值中存在大于或等于预设值的第五损失值,则调整保留网络的参数,直到各个第五损失值均小于预设值。解决了现有的数据表预训练方法忽视了NL问题与数据库模式之间的交互,使得训练模型输出的结果准确性较低的问题。

    一种语义相似度处理方法、装置、系统以及存储介质

    公开(公告)号:CN115329883A

    公开(公告)日:2022-11-11

    申请号:CN202211006720.X

    申请日:2022-08-22

    Inventor: 蔡晓东 蒋鹏

    Abstract: 本发明提供一种语义相似度处理方法、装置、系统以及存储介质,属于语言处理领域,方法包括:对原始句子数据集的筛选得到多个待测句子组;对待测句子组的提取关键字分析得到句子关键信息组以及意图信息组;对待测句子组、句子关键信息组以及意图信息组的隐藏层计算得到待测句子隐藏层、句子关键信息隐藏层以及意图信息隐藏层;根据待测句子隐藏层、句子关键信息隐藏层以及意图信息隐藏层的目标相似度分数评价分析得到语义相似度处理结果。本发明能够免受匹配语句长度的分歧,利用关键信息和潜在意图判断句子语义相似,以及利用最优化中的单纯形法保证了最优化句子匹配,提高了语义相似度结果的准确率,使得匹配的结果更加理想。

    一种段落的语义信息处理方法、装置及存储介质

    公开(公告)号:CN114881040A

    公开(公告)日:2022-08-09

    申请号:CN202210517950.6

    申请日:2022-05-12

    Inventor: 蔡晓东 蒋鹏

    Abstract: 本发明涉及一种段落的语义信息处理方法、装置及存储介质,属于语义信息处理技术领域;方法包括:导入原始段落、语义逻辑切割模型和语义理解及表达模型;将原始段落输入语义逻辑切割模型中进行逻辑切割,得到原始段落的逻辑切割跨度信息;将原始段落的逻辑切割跨度信息输入语义理解及表达模型中进行语义处理,得到原始段落的逻辑切割跨度信息的语义信息;将逻辑切割跨度信息的语义信息添加到原始段落中,得到完整段落;根据语义逻辑切割模型和语义理解及表达模型对完整段落进行更新迭代处理,得到最终的语义信息。本发明能够得到准确而全面的段落语义信息,且通过关注段落上下文的逻辑界线来提高段落语义理解和表达的准确性。

    一种摘要评价方法及装置

    公开(公告)号:CN111930931B

    公开(公告)日:2024-05-24

    申请号:CN202010697992.3

    申请日:2020-07-20

    Inventor: 蔡晓东 蒋鹏

    Abstract: 本发明提供一种摘要评价方法及装置,方法包括:录入摘要信息和原文信息,将摘要信息和原文信息作为待评价语句信息;将所述待评价语句信息输入预先构建的语义相似模型中的语义相似度处理得到语义相似度得分;对所述待评价语句信息的评价得分处理得到ROUGE得分;根据语义相似度得分对ROUGE得分的最优融合分析得到最优融合组;对最优融合组的融合分数计算得到最优融合分数,并通过最优融合分数得到摘要评价分数。本发明实现了既计算了待评价语句的共现信息又计算了待评价语句的深层语义信息,提高了对摘要的客观评分能力,也避免评价分数受参考摘要主观性的影响。

    多方向多角度句子语义相似识别方法、装置及存储介质

    公开(公告)号:CN116245111B

    公开(公告)日:2023-09-15

    申请号:CN202310120682.9

    申请日:2023-02-15

    Inventor: 蔡晓东 蒋鹏

    Abstract: 本发明提供一种多方向多角度句子语义相似识别方法、装置及存储介质,主要涉及自然语言处理技术领域,本方法包括提取语义序列,并通过语义序列分离出关键信息、意图信息、关系信息和时间线索信息,采用了提取相似性特征和区分性特征的新型注意力机制,对上述融合后的各个信息进行损失函数的叠加,作为整体训练函数,能够捕获并利用语料中的细节信息进而提升句子匹配准确率。

Patent Agency Ranking