一种基于文本挖掘的标准要素查重方法

    公开(公告)号:CN116629228A

    公开(公告)日:2023-08-22

    申请号:CN202310375469.2

    申请日:2023-04-11

    Abstract: 本发明公开了一种基于文本挖掘的标准要素查重方法,包括如下步骤:根据上传的标准文本,从中提取有关信息;对提取的有关信息进行特征抽取,即对文件进行切分,从而组成文本的特征集合;经过特征抽取后的文本集合经数学描述计算相似度;计算标准文本中每个句子的相似度,并取其中最高值,作为该要素板块与对比标准文本的总相似度;将各个要素板块的总相似度进行加权平均,最终得到上传标准文本内容以及对比的标准文本内容的文本相似度;抽样分析聚类结果是否符合要求。本发明减少查重的工作量,减少词条交叉重复问题,准确度高,且流程易操作,能极大的提高对标准文本进行查重比对工作的效率。

    一种基于文本挖掘的标准智能推荐方法

    公开(公告)号:CN116450803A

    公开(公告)日:2023-07-18

    申请号:CN202310354456.7

    申请日:2023-04-06

    Abstract: 本发明公开了一种基于文本挖掘的标准智能推荐方法,包括如下步骤:获取文本数据信息,并对文本数据信息进行分词划分得到至少一组关键词;从文本数据信息中选取标准文本作为待推荐文本进行推荐;根据所述关键词在数据库内匹配与所述关键词相关的数据标准名,得到标准化集合;识别所述待推荐文本获取数据特征的结果集合,保存与所述结果集合的数据吻合的标准化集合。本发明通过对文本数据信息进行分词划分提取出关键词,通过关键词在数据库中匹配相关的数据标准名,极大的减轻了接入人员工作负担,以及数据标准对标过程中出现的误对问题,提升大数据智能化接入效率和准确性。

Patent Agency Ranking