一种面向开源信息采集的资源更新时间预测方法及系统

    公开(公告)号:CN110069692B

    公开(公告)日:2021-04-20

    申请号:CN201910371392.5

    申请日:2019-05-06

    Abstract: 本发明公开了一种面向开源信息采集的资源更新时间预测方法及系统。所述方法通过CART决策树算法建立网站资源更新时间和资源更新数量的CART决策树模型,并采用十折交叉法确定所述CART决策树模型的准确性,如果模型准确性满足要求,就可以采用建立的CART决策树模型预测网站未来的更新时间及资源更新数量,从而可以根据预测更新时间自动设置爬虫系统的资源采集时间,定时从目标网站采集所需要的信息资源,有效解决了数据采集过程中难以设置采集频率的问题,同时也避免了人工设置采集时间过于密集导致的对目标网站多次频繁采集的问题,节省了数据采集的计算资源。

    一种面向国防领域防务智库的文本情感分析方法

    公开(公告)号:CN112464646A

    公开(公告)日:2021-03-09

    申请号:CN202011318544.4

    申请日:2020-11-23

    Abstract: 本发明涉及一种面向国防领域防务智库的文本情感分析方法和系统,所述方法包括以下步骤:获取国防领域防务智库的文本;进行切分处理,得到句子集合;预处理并且采用条件随机场算法进行分词;运用基于主观2‑POS模型的CHI统计方法对每个句子进行条件筛选,获得主观句子集合;对情感表达词进行程度等级划分;之后进行标志性句子判断;对主观句中的每个词汇进行情感倾向统计,并根据情感计算模型对每个主观句的最终得分进行计算,计算文本的最终情感得分;计算文本的情感倾向值。采用本发明的文本情感分析方法,对国防领域防务智库文本报告进行自主分析,提升了分析的准确度和时效性,为国防领域的科技人员提供了快速、准确的参考。

    一种信息检索方法及系统

    公开(公告)号:CN110334269A

    公开(公告)日:2019-10-15

    申请号:CN201910622980.1

    申请日:2019-07-11

    Abstract: 本发明公开一种信息检索方法及系统。本发明提供的信息检索方法及系统,首先计算待查找关键词集合与国防科技情报领域待查数据源的网页文档集合中各个网页文档的相关性;然后将相关性大于或者等于相似阈值的网页文档输出,并将相关性小于相似阈值的网页文档按照时序性由高到低的顺序输出。本发明提供的检索方法及系统,将相关性较大的网页文档作为检索结果输出,能够确保检索结果的覆盖率,同时,对于相关性较小的网页文档,按照其时序性由高到低的顺序输出给用户,能够满足资讯检索的高时效性要求。因此,采用本发明提供的方法及系统进行国防科技情报领域的信息检索,能够同时满足其高时效性和高覆盖率的要求。

    一种面向国防科技领域的知识处理方法及系统

    公开(公告)号:CN109522396A

    公开(公告)日:2019-03-26

    申请号:CN201811226250.1

    申请日:2018-10-22

    Abstract: 本发明公开一种面向国防科技领域的知识处理方法及系统。所述知识处理方法包括:获取国防科技领域的多个文本资料;从所述文本资料中提取初始的知识本体;所述初始的知识本体为三元组集合,每一个三元组都包括实体、关系和描述三个元素;对所述多个文本资料进行分词,得到多个词段;对于每个所述词段,确定对应的词段组合;将共现概率大于设定概率阈值的词段组合,确定为新的知识本体;将所述新的知识本体补充入所述初始的知识本体中,形成更新后的知识本体;所述更新后的知识本体用于国防科技领域智能问答时使用。采用本发明的知识处理方法,对国防科技领域的知识实现了系统的处理,构建了完整的知识本体,实现了国防科技领域的智能问答。

    一种信息检索方法及系统

    公开(公告)号:CN110334269B

    公开(公告)日:2021-05-07

    申请号:CN201910622980.1

    申请日:2019-07-11

    Abstract: 本发明公开一种信息检索方法及系统。本发明提供的信息检索方法及系统,首先计算待查找关键词集合与国防科技情报领域待查数据源的网页文档集合中各个网页文档的相关性;然后将相关性大于或者等于相似阈值的网页文档输出,并将相关性小于相似阈值的网页文档按照时序性由高到低的顺序输出。本发明提供的检索方法及系统,将相关性较大的网页文档作为检索结果输出,能够确保检索结果的覆盖率,同时,对于相关性较小的网页文档,按照其时序性由高到低的顺序输出给用户,能够满足资讯检索的高时效性要求。因此,采用本发明提供的方法及系统进行国防科技情报领域的信息检索,能够同时满足其高时效性和高覆盖率的要求。

    一种面向国防科技领域的文本关键词提取方法及系统

    公开(公告)号:CN110162791A

    公开(公告)日:2019-08-23

    申请号:CN201910438831.X

    申请日:2019-05-24

    Abstract: 本发明公开了一种面向国防科技领域的文本关键词提取方法及系统。所述方法通过大量样本训练出一套能从国防科技某一领域的文本中精准提取能表征文章主要内容的关键词的机器处理机制,训练样本的质与量保证了关键词提取的正确性与权威性,完整的训练方法保证了提取过程改善的持续性。采用本发明方法提取的关键词是根据其指代的概念特征提取的,即便其本身可能并未在文章中出现,但仍能够通过语义特征准确反映文章主题,从而解决了基于词频方法提取关键词不够准确、检索命中率不高的问题。

    一种面向国防科技领域的多源数据融合方法及系统

    公开(公告)号:CN110083654A

    公开(公告)日:2019-08-02

    申请号:CN201910360665.6

    申请日:2019-04-30

    Abstract: 本发明公开了一种面向国防科技领域的多源数据融合方法及系统。所述方法及系统将原本内外隔离的不同来源、不同类型的内、外部资料数据进行融合,形成统一的数据资源库为用户提供检索、查询服务,解决了国防科技科研生产内部数据资源共享利用率低、非结构化数据缺乏有效整合、不同来源数据难以统一分析处理的问题,实现了将国防科技领域的内部数据与开源数据相融合的数据组织,显著提高数据资源的利用率;此外根据本发明提取的标签进行多类型数据文件检索,可以有效提高多源多类型数据文件的查询、检索效率。

Patent Agency Ranking