基于知识增强预训练模型的代码摘要自动生成方法

    公开(公告)号:CN117193848A

    公开(公告)日:2023-12-08

    申请号:CN202311042102.5

    申请日:2023-08-18

    Inventor: 陈萌 顾小东

    Abstract: 一种基于知识增强的预训练模型的代码摘要方法及系统,通过构建知识图谱,将代码知识引入预训练数据并用于对Transfomer模型进行代码知识增强的预训练,经代码摘要生成任务的微调后,通过Transfomer模型进行代码知识预测,生成代码摘要。本发明将知识图谱与训练代码语料结合,使用代码知识预测任务对模型进行预训练,从而将知识隐式地结合到学到的表征中,在不影响效率的情况下提升其在下游代码摘要生成任务上的准确性和可靠性。

    基于文本编辑和语法纠错的多轮对话改写方法及系统

    公开(公告)号:CN113609824A

    公开(公告)日:2021-11-05

    申请号:CN202110912343.5

    申请日:2021-08-10

    Abstract: 一种基于文本编辑和语法纠错的多轮对话改写方法及系统,首先利用文本标注算法对收集到的对话数据文本进行单词级别的标注生成文本标注数据,用于对基于变形的双向编码表征模型进行微调得到序列标注模型,并根据该模型的预测序列中每个单词的分类标签对对话历史和不完整语句进行编辑,最后对改写后的文本进行语法纠错建模提高语句的流畅度。本发明能够提高多轮对话改写的准确度,在对话中利用文本编辑和语法纠错的方法,有效解决对话系统中指代和省略的问题,提高对话语句的完整度。

Patent Agency Ranking