一种企业名称对齐方法、电子设备和存储介质

    公开(公告)号:CN115952801A

    公开(公告)日:2023-04-11

    申请号:CN202211724914.3

    申请日:2022-12-28

    摘要: 本发明提供了一种企业名称对齐方法,包括:获取目标文本信息中的企业代称,以及与所述企业代称相关的关联地域实体和关联人物实体;获取所述企业代称中的构成要素,并基于获取的构成要素获取所述企业代称对应的企业简称集合,所述构成要素包括商号、地域、行业和机构类型中的至少一个;基于所述企业代称和对应的企业简称集合,获取与所述企业代称相关的候选企业信息列表,所述候选企业信息列表中包括n个候选企业信息,所述候选企业信息至少包括对应候选企业的企业名称;基于所述n个候选企业信息,获取与所述企业代称相关的目标企业名称。本发明还提供一种电子设备和存储介质。本发明能够提高企业名称对齐的准确率。

    一种文本原创识别方法、装置、电子设备及存储介质

    公开(公告)号:CN113553839A

    公开(公告)日:2021-10-26

    申请号:CN202010340711.9

    申请日:2020-04-26

    IPC分类号: G06F40/279 G06F40/194

    摘要: 本申请涉及一种文本原创识别方法、装置、电子设备及存储介质,该方法包括:获取待识别的第一文本数据,以及与所述第一文本数据相关联的第二文本数据;确定所述第一文本数据的来源信息;当所述来源信息不满足于预设条件时,对所述第一文本数据和所述第二文本数据进行比较,得到相似度特征指标;将所述相似度特征指标输入训练好的识别模型,由所述识别模型根据所述相似度特征指标进行计算得到所述文本数据的原创识别结果。该技术方案一方面通过基于来源信息对文本进行初步原创判断,另一方面采用相似度指标对文本进行原创识别,以此种方式提高了原创识别的准确性和有效性,本申请采用的方法能够更好的服务于新闻工作的需求。