一种数据出版物学术影响力评价预测方法

    公开(公告)号:CN110659768B

    公开(公告)日:2023-01-17

    申请号:CN201910749170.2

    申请日:2019-08-14

    Inventor: 李成赞 杜一

    Abstract: 本发明提出一种数据出版物学术影响力评价预测方法,包括如下步骤:提取数据论文个体的不同时间段的引用次数和引用格式文件下载次数,计算得到不同时间段的引用转化率数据;选择回归模型,根据引用转化率数据,利用曲线拟合方法进行拟合;根据拟合的结果,构建数据论文个体的影响力评价预测模型,利用该影响力评价预测模型,计算数据论文个体的某时间段的引用次数,实现影响力的评价或预测。本方法能够有效评价并预测各个数据论文的引用影响力情况。

    一种基于图数据库的数据集文件版本控制方法和系统

    公开(公告)号:CN116991460A

    公开(公告)日:2023-11-03

    申请号:CN202310509400.4

    申请日:2023-05-08

    Abstract: 本发明涉及一种基于图数据库的数据集文件版本控制方法和系统。该方法对数据集文件建立图数据库模型;基于图数据库模型,通过创建节点和关系,以镜像的方式构建新的数据集文件版本;对于新的数据集文件版本,通过构建中间件驱动程序实现文件操作。所述图数据库模型包括Dataset节点、Version节点、File节点、Blob节点共4类节点,以及HAS_VERSION关系、CONTAINS关系、REF_BLOB关系共3类关系。本发明将文件的比特信息内容和元信息内容分离,建立元信息内容和比特信息内容的关系,利用图数据库能够对节点和关系快速检索和遍历的技术特点,能够实现文件版本的建立、管理、以及目录的结构的快速遍历查找。

    一种数据出版物学术影响力评价预测方法

    公开(公告)号:CN110659768A

    公开(公告)日:2020-01-07

    申请号:CN201910749170.2

    申请日:2019-08-14

    Inventor: 李成赞 杜一

    Abstract: 本发明提出一种数据出版物学术影响力评价预测方法,包括如下步骤:提取数据论文个体的不同时间段的引用次数和引用格式文件下载次数,计算得到不同时间段的引用转化率数据;选择回归模型,根据引用转化率数据,利用曲线拟合方法进行拟合;根据拟合的结果,构建数据论文个体的影响力评价预测模型,利用该影响力评价预测模型,计算数据论文个体的某时间段的引用次数,实现影响力的评价或预测。本方法能够有效评价并预测各个数据论文的引用影响力情况。

    一种科学数据内容级细粒度可控供给方法及系统

    公开(公告)号:CN118035190A

    公开(公告)日:2024-05-14

    申请号:CN202410036687.8

    申请日:2024-01-10

    Abstract: 本发明公开一种科学数据内容级细粒度可控供给方法及系统,该方法包括:构建科学数据解析器的热加载运行环境;建设科学数据解析器资源池,所述科学数据解析器资源池中的科学数据解析器包括:为所有数据文件提供的默认数据解析器、为常见数据格式的数据文件提供的通用格式数据文件解析器和为特定领域数据文件提供的领域专用数据解析器;建立每一数据文件和科学数据解析器的对应关系,并在所述科学数据解析器资源池更新时,对所述对应关系进行更新;基于所述对应关系组装所述数据文件和所述科学数据解析器,以实现数据文件的线上内容级供给服务。本发明实现了数据利用的安全可控、可用不可见以及可计量可评价。

    一种基于引文网络社区发现的数据推荐方法

    公开(公告)号:CN110674318A

    公开(公告)日:2020-01-10

    申请号:CN201910748028.6

    申请日:2019-08-14

    Inventor: 李成赞 杜一

    Abstract: 本发明提供一种基于引文网络社区发现的数据推荐方法,包括以下步骤:基于作者之间的合著关系、论文之间的共引和耦合关系,构建引文网络;针对引文网络,利用模块度Louvain算法发现具有相似或相关研究内容的社区网络;基于论文与数据集之间的相似度,建立数据集与社区网络之间的关联;将与数据集建立起关联的社区网络中各论文节点进行叠加去重,再进行数据推荐。

Patent Agency Ranking