一种面向开源信息采集的资源更新时间预测方法及系统

    公开(公告)号:CN110069692A

    公开(公告)日:2019-07-30

    申请号:CN201910371392.5

    申请日:2019-05-06

    Abstract: 本发明公开了一种面向开源信息采集的资源更新时间预测方法及系统。所述方法通过CART决策树算法建立网站资源更新时间和资源更新数量的CART决策树模型,并采用十折交叉法确定所述CART决策树模型的准确性,如果模型准确性满足要求,就可以采用建立的CART决策树模型预测网站未来的更新时间及资源更新数量,从而可以根据预测更新时间自动设置爬虫系统的资源采集时间,定时从目标网站采集所需要的信息资源,有效解决了数据采集过程中难以设置采集频率的问题,同时也避免了人工设置采集时间过于密集导致的对目标网站多次频繁采集的问题,节省了数据采集的计算资源。

    基于知识图谱的军工科研生产数据相似性判别方法及系统

    公开(公告)号:CN113934864A

    公开(公告)日:2022-01-14

    申请号:CN202111221214.8

    申请日:2021-10-20

    Abstract: 本发明实施例提供一种基于知识图谱的军工科研生产数据相似性判别方法及系统,包括构建本体体系,包括构建产生军工科研生产数据的本体以及本体之间的第一关联关系,其中,本体包括多种元素;构建知识图谱,包括基于本体体系,从原始文件中提取实体以及每个原始文件中所包含实体之间的第二关联关系,并在进行实体对齐和关联关系推理后,生成原始文件对应的知识图谱,其中,实体为本体的多种元素中的至少一种;构建知识子图,包括基于知识图谱,抽取获得待判别文件中每个待判别文件的实体的数量信息和第二关联关系的数量信息,确定每个待判别文件的知识子图;基于每个待判别文件的知识子图,判别待判别文件的相似性。

    一种面向国防科技领域的文献检索方法及系统

    公开(公告)号:CN109299466B

    公开(公告)日:2023-07-07

    申请号:CN201811226247.X

    申请日:2018-10-22

    Abstract: 本发明公开一种面向国防科技领域的文献检索方法及系统。该文献检索方法包括:获取用户输入的检索式;对所述用户输入的检索式进行语义分析,确定所述检索式包含的关键词,确定所述检索式所属的知识节点;所述知识节点为国防科技知识体系中的知识节点,所述国防科技知识体系包括多个知识节点,每个知识节点挂载多篇国防科技领域的文献;根据所述检索式包含的关键词,从所述检索式所属的知识节点中筛选出对应的文献,得到检索后的文献;将所述检索后的文献显示给所述用户。采用本发明的文献检索方法或系统,可以实现国防科技领域的精准文献检索,提高检索准确性。

    一种面向国防科技领域的知识处理方法及系统

    公开(公告)号:CN109522396B

    公开(公告)日:2020-12-25

    申请号:CN201811226250.1

    申请日:2018-10-22

    Abstract: 本发明公开一种面向国防科技领域的知识处理方法及系统。所述知识处理方法包括:获取国防科技领域的多个文本资料;从所述文本资料中提取初始的知识本体;所述初始的知识本体为三元组集合,每一个三元组都包括实体、关系和描述三个元素;对所述多个文本资料进行分词,得到多个词段;对于每个所述词段,确定对应的词段组合;将共现概率大于设定概率阈值的词段组合,确定为新的知识本体;将所述新的知识本体补充入所述初始的知识本体中,形成更新后的知识本体;所述更新后的知识本体用于国防科技领域智能问答时使用。采用本发明的知识处理方法,对国防科技领域的知识实现了系统的处理,构建了完整的知识本体,实现了国防科技领域的智能问答。

    一种面向军工科研生产数据的字符识别方法及系统

    公开(公告)号:CN113936282A

    公开(公告)日:2022-01-14

    申请号:CN202111221209.7

    申请日:2021-10-20

    Abstract: 本发明实施例提供一种面向军工科研生产数据的字符识别方法包括:获取基于预处理后的军工科研生产数据,采用文本检测技术框选出图像的文本区域,对文本区域进行字符识别后输出的每个字符的初始识别结果以及识别准确率;获取被抽取字符所对应的文本区域的初始图像,基于预设判别标准,通过预设辨别模块初始图像进行判别;若预设辨别模块的判别结果与初始识别结果一致,则确定初始识别结果正确;若预设辨别模块的判别结果与初始识别结果不一致,则确定初始识别结果错误;被抽取字符的抽取概率基于文档识别要求、字符数量、每个字符的识别准确率以及识别错误频次确定。结合文档识别要求和字符的识别准确率,随机抽取字符下进行识别,提升校对效率。

    一种信息检索方法及系统
    10.
    发明授权

    公开(公告)号:CN110334269B

    公开(公告)日:2021-05-07

    申请号:CN201910622980.1

    申请日:2019-07-11

    Abstract: 本发明公开一种信息检索方法及系统。本发明提供的信息检索方法及系统,首先计算待查找关键词集合与国防科技情报领域待查数据源的网页文档集合中各个网页文档的相关性;然后将相关性大于或者等于相似阈值的网页文档输出,并将相关性小于相似阈值的网页文档按照时序性由高到低的顺序输出。本发明提供的检索方法及系统,将相关性较大的网页文档作为检索结果输出,能够确保检索结果的覆盖率,同时,对于相关性较小的网页文档,按照其时序性由高到低的顺序输出给用户,能够满足资讯检索的高时效性要求。因此,采用本发明提供的方法及系统进行国防科技情报领域的信息检索,能够同时满足其高时效性和高覆盖率的要求。

Patent Agency Ranking