一种基于BERTSUM模型的文本摘要提取方法

    公开(公告)号:CN114139497A

    公开(公告)日:2022-03-04

    申请号:CN202111519931.9

    申请日:2021-12-13

    Abstract: 本发明属于文本摘要提取技术领域,尤其为一种基于BERTSUM模型的文本摘要提取方法先对需要提取摘要的文本进行预处理,然后将预处理后的数据输入改进的BERT模型进行处理,判断出应该出现在摘要中的句子,BERT模型的改进过程中,在BERT模型原本的损失函数中增加一个余弦相似度损失,避免了数据处理中过度拟合,使得获得的摘要更加准确;另外,通过加入余弦相似性约束,使得BERT模型在训练早期,获得的结果的损失能够更快的下降,提高数据处理的速度;BERT模型的改进方面还包括加入融合指针网络的UniLM模型,通过融合指针网络的UniLM模型对文本下游生成任务进行微调,提前获取文本中的关键信息词,提高文本摘要的获得速度。

    核心数据识别方法及系统
    14.
    发明公开

    公开(公告)号:CN113505605A

    公开(公告)日:2021-10-15

    申请号:CN202110837745.3

    申请日:2021-07-23

    Abstract: 本发明公开了一种核心数据识别方法及系统,该方法包括:确定核心数据的评判因素;根据所述核心数据的评判因素划分出核心数据的各个判断因子以及所述各个判断因子的权重从而构建出核心数据识别模型;确定所述各个判断因子的算法模型;导入待识别核心数据的数据资源;根据所述核心数据识别模型以及所述算法模型对导入的数据资源进行核心数据的识别。本发明提供的核心数据识别方法及系统构建了核心数据识别模型,基于该核心数据识别模型可以快速自动识别出核心数据。

Patent Agency Ranking