Patent search ap:("中国标准化研究院") AND inv:"张曦" Page 2

11.

发明公开
一种基于文本挖掘的标准要素查重方法审中-公开

公开(公告)号：CN116629228A

公开(公告)日：2023-08-22

申请号：CN202310375469.2

申请日：2023-04-11

Applicant: 中国标准化研究院

Inventor： 张曦 , 王静雅 , 孙宇宁 , 于钢

IPC: G06F40/194 , G06F40/279 , G06F18/22 , G06F18/23

Abstract: 本发明公开了一种基于文本挖掘的标准要素查重方法，包括如下步骤：根据上传的标准文本，从中提取有关信息；对提取的有关信息进行特征抽取，即对文件进行切分，从而组成文本的特征集合；经过特征抽取后的文本集合经数学描述计算相似度；计算标准文本中每个句子的相似度，并取其中最高值，作为该要素板块与对比标准文本的总相似度；将各个要素板块的总相似度进行加权平均，最终得到上传标准文本内容以及对比的标准文本内容的文本相似度；抽样分析聚类结果是否符合要求。本发明减少查重的工作量，减少词条交叉重复问题，准确度高，且流程易操作，能极大的提高对标准文本进行查重比对工作的效率。

12.

发明公开
一种基于文本挖掘的标准智能推荐方法审中-实审

公开(公告)号：CN116450803A

公开(公告)日：2023-07-18

申请号：CN202310354456.7

申请日：2023-04-06

Applicant: 中国标准化研究院

Inventor： 张曦 , 王静雅 , 孙宇宁 , 于钢

IPC: G06F16/335 , G06F16/33 , G06F40/284

Abstract: 本发明公开了一种基于文本挖掘的标准智能推荐方法，包括如下步骤：获取文本数据信息，并对文本数据信息进行分词划分得到至少一组关键词；从文本数据信息中选取标准文本作为待推荐文本进行推荐；根据所述关键词在数据库内匹配与所述关键词相关的数据标准名，得到标准化集合；识别所述待推荐文本获取数据特征的结果集合，保存与所述结果集合的数据吻合的标准化集合。本发明通过对文本数据信息进行分词划分提取出关键词，通过关键词在数据库中匹配相关的数据标准名，极大的减轻了接入人员工作负担，以及数据标准对标过程中出现的误对问题，提升大数据智能化接入效率和准确性。

Patent Agency Ranking