一种投标文件主观内容相似度的确定方法

    公开(公告)号:CN115757741A

    公开(公告)日:2023-03-07

    申请号:CN202211505034.7

    申请日:2022-11-28

    Abstract: 本发明公开了一种投标文件主观内容相似度的确定方法,其特征在于:所述方法包括:步骤1、计算投标文件技术方案与招标文件提供的技术规范书附件的数据相似度;步骤2、当数据相似度大于预定阈值时,判定为重复文本,去除的投标文件技术方案中与技术规范书等附件重复文本,并标记该重复文本;步骤3、对步骤2处理后的文本,利用分词工具进行分词;步骤4、对分好的关键词赋予相应权重;步骤5、计算步骤2去重后各投标文件技术方案的签名值;步骤6、计算出相似度;解决在计算投标文件相似度过程中,复制的客观内容会增加不同投标文件之间的相似度,因此存在不能客观、合理及准确的计算出两投标文件主观内容的相似度等技术问题。

    基于分布式文件系统流式数据实时更新插入合并处理方法

    公开(公告)号:CN115729899A

    公开(公告)日:2023-03-03

    申请号:CN202211522988.9

    申请日:2022-11-30

    Abstract: 本发明公开了一种基于分布式文件系统流式数据实时更新插入合并处理方法,所述方法包括:步骤1、在分布式文件系统上对接入的流式数据以单个表为单位按时间间隔进行分区操作;步骤2、采用流数据中主键字段的值作为该条数据的key值;步骤3、将数据的key值和当前数据所在的分区号建立唯一映射关系,把这种映射关系存放在第三方数据库中,利用第三方数据库完成索引的构建;步骤4、当每条流式数据开始接入时,执行更新或插入操作;步骤5、根据触发机制来对分区文件夹中的文件进行合并;解决了现有技术的分布式文件系统中无法实时对流数据更新插入的合并操作。

    一种IT资产安全管控平台及管理方法

    公开(公告)号:CN115695044A

    公开(公告)日:2023-02-03

    申请号:CN202211517250.3

    申请日:2022-11-29

    Abstract: 本发明公开了一种IT资产安全管控平台,其特征在于:所述平台包括外链业务模块、数据验证模块、身份验证模块、数据存储模块、数据监管模块及平台管控模块;所述外链业务模块为与外部业务端口相连进行IT资产数据同步;所述数据验证模块为对录入的IT资产数据进行数据来源验证;所述身份验证模块为验证登录信息进行操作管控;所述数据存储模块为用于分布式存储IT资产数据;所述数据监管模块为对IT资产数据进行安全筛查;所述平台管控模块为对平台运行规则、异常数据筛查规则、异常数据处理策略及数据分布式存储规则进行制定及执行;本发明架构简单,易于部署,资产管理步骤简单,能够实现IT资产数据的统一管理和动态监测。

    一种从海量文本中抽取里程碑事件的方法

    公开(公告)号:CN110245209B

    公开(公告)日:2022-09-23

    申请号:CN201910539127.3

    申请日:2019-06-20

    Abstract: 本发明公开了一种从海量文本中抽取里程碑事件的方法,该方法包括步骤:(1)在海量文本中抽取文件的文件夹层级关联信息,通过树形结构进行数据存储;(2)将文件名和文件的路径名进行拼接作为当前文件的文本,使用K‑Means聚类算法计算每个文件的树形距离,将具有相同层级关系的文件划分在一起作为初始聚类簇,确定K‑Means聚类算法的初始类簇大小;(3)在每一个聚类簇下进行里程碑事件和时间节点的抽取,对抽取结果做筛选后形成事件的里程碑节点列表。本发明在聚类后的每一个簇中再进行里程碑事件和事件节点的抽取,这样可以避免相同事件被抽取成多个子事件后无法合并的问题,同时也提高了抽取的准确率以及完整性。

    一种从海量文本中抽取里程碑事件的方法

    公开(公告)号:CN110245209A

    公开(公告)日:2019-09-17

    申请号:CN201910539127.3

    申请日:2019-06-20

    Abstract: 本发明公开了一种从海量文本中抽取里程碑事件的方法,该方法包括步骤:(1)在海量文本中抽取文件的文件夹层级关联信息,通过树形结构进行数据存储;(2)将文件名和文件的路径名进行拼接作为当前文件的文本,使用K-Means聚类算法计算每个文件的树形距离,将具有相同层级关系的文件划分在一起作为初始聚类簇,确定K-Means聚类算法的初始类簇大小;(3)在每一个聚类簇下进行里程碑事件和时间节点的抽取,对抽取结果做筛选后形成事件的里程碑节点列表。本发明在聚类后的每一个簇中再进行里程碑事件和事件节点的抽取,这样可以避免相同事件被抽取成多个子事件后无法合并的问题,同时也提高了抽取的准确率以及完整性。

Patent Agency Ranking