一种文献作者重名检测方法

    公开(公告)号:CN106021424B

    公开(公告)日:2019-05-28

    申请号:CN201610320129.X

    申请日:2016-05-13

    Abstract: 本发明公开了一种文献作者重名检测方法,属于数据挖掘技术领域。本发明方法充分利用了科技文献中单特征相似度以及单特征融合在对重名作者进行消歧的特点,首先对要使用到的文献对象进行建模,其次利用一种单特征相似度检测方法计算两两单特征的相似度,然后利用基于单特征相似度的消歧方法计算每一个单特征的鉴别力,在此基础上设计多特征融合的消歧规则,并提出一种文献作者重名检测方法。由于本检测方法融合了单特征各自在进行作者实体消歧时的优点,使得方法在识别过程中具有较好的精确度和召回率。

    一种面向云存储系统的数据副本数量确定方法

    公开(公告)号:CN103997512B

    公开(公告)日:2017-06-30

    申请号:CN201410149010.1

    申请日:2014-04-14

    Abstract: 本发明提出一种面向云存储系统的数据副本数量确定方法,其方法基于数据流行度与节点热度,以满足服务需求、控制数据副本数量为目标,对数据分类并预测不同数据的数据副本需求数,提前增加数据副本,或及时删除过多的数据副本,本发明方法包含以下几个环节:分析数据流行度预测模型;预测数据副本变化数;计算节点热度;增加/删除数据副本;迁移数据副本。方法减少数据副本需求数,降低了硬件成本,减轻了系统的数据维护负担,降低了热点问题的发生概率,有效提高了数据副本的利用率。

    一种文献作者重名检测方法

    公开(公告)号:CN106021424A

    公开(公告)日:2016-10-12

    申请号:CN201610320129.X

    申请日:2016-05-13

    Abstract: 本发明公开了一种文献作者重名检测方法,属于数据挖掘技术领域。本发明方法充分利用了科技文献中单特征相似度以及单特征融合在对重名作者进行消歧的特点,首先对要使用到的文献对象进行建模,其次利用一种单特征相似度检测方法计算两两单特征的相似度,然后利用基于单特征相似度的消歧方法计算每一个单特征的鉴别力,在此基础上设计多特征融合的消歧规则,并提出一种文献作者重名检测方法。由于本检测方法融合了单特征各自在进行作者实体消歧时的优点,使得方法在识别过程中具有较好的精确度和召回率。

    一种面向云存储系统的数据副本数量确定方法

    公开(公告)号:CN103997512A

    公开(公告)日:2014-08-20

    申请号:CN201410149010.1

    申请日:2014-04-14

    Abstract: 本发明提出一种面向云存储系统的数据副本数量确定方法,其方法基于数据流行度与节点热度,以满足服务需求、控制数据副本数量为目标,对数据分类并预测不同数据的数据副本需求数,提前增加数据副本,或及时删除过多的数据副本,本发明方法包含以下几个环节:分析数据流行度预测模型;预测数据副本变化数;计算节点热度;增加/删除数据副本;迁移数据副本。方法减少数据副本需求数,降低了硬件成本,减轻了系统的数据维护负担,降低了热点问题的发生概率,有效提高了数据副本的利用率。

Patent Agency Ranking