-
公开(公告)号:CN110069692A
公开(公告)日:2019-07-30
申请号:CN201910371392.5
申请日:2019-05-06
Applicant: 中国船舶工业综合技术经济研究院
IPC: G06F16/951 , G06K9/62 , G06Q10/04
Abstract: 本发明公开了一种面向开源信息采集的资源更新时间预测方法及系统。所述方法通过CART决策树算法建立网站资源更新时间和资源更新数量的CART决策树模型,并采用十折交叉法确定所述CART决策树模型的准确性,如果模型准确性满足要求,就可以采用建立的CART决策树模型预测网站未来的更新时间及资源更新数量,从而可以根据预测更新时间自动设置爬虫系统的资源采集时间,定时从目标网站采集所需要的信息资源,有效解决了数据采集过程中难以设置采集频率的问题,同时也避免了人工设置采集时间过于密集导致的对目标网站多次频繁采集的问题,节省了数据采集的计算资源。
-
公开(公告)号:CN113934864A
公开(公告)日:2022-01-14
申请号:CN202111221214.8
申请日:2021-10-20
Applicant: 中国船舶工业综合技术经济研究院
Abstract: 本发明实施例提供一种基于知识图谱的军工科研生产数据相似性判别方法及系统,包括构建本体体系,包括构建产生军工科研生产数据的本体以及本体之间的第一关联关系,其中,本体包括多种元素;构建知识图谱,包括基于本体体系,从原始文件中提取实体以及每个原始文件中所包含实体之间的第二关联关系,并在进行实体对齐和关联关系推理后,生成原始文件对应的知识图谱,其中,实体为本体的多种元素中的至少一种;构建知识子图,包括基于知识图谱,抽取获得待判别文件中每个待判别文件的实体的数量信息和第二关联关系的数量信息,确定每个待判别文件的知识子图;基于每个待判别文件的知识子图,判别待判别文件的相似性。
-
公开(公告)号:CN109299466B
公开(公告)日:2023-07-07
申请号:CN201811226247.X
申请日:2018-10-22
Applicant: 中国船舶工业综合技术经济研究院
IPC: G06F40/289 , G06F40/30 , G06F16/33 , G06F16/31
Abstract: 本发明公开一种面向国防科技领域的文献检索方法及系统。该文献检索方法包括:获取用户输入的检索式;对所述用户输入的检索式进行语义分析,确定所述检索式包含的关键词,确定所述检索式所属的知识节点;所述知识节点为国防科技知识体系中的知识节点,所述国防科技知识体系包括多个知识节点,每个知识节点挂载多篇国防科技领域的文献;根据所述检索式包含的关键词,从所述检索式所属的知识节点中筛选出对应的文献,得到检索后的文献;将所述检索后的文献显示给所述用户。采用本发明的文献检索方法或系统,可以实现国防科技领域的精准文献检索,提高检索准确性。
-
公开(公告)号:CN110287302B
公开(公告)日:2021-03-30
申请号:CN201910572637.0
申请日:2019-06-28
Applicant: 中国船舶工业综合技术经济研究院
IPC: G06F16/332 , G06F16/36 , G06F40/279 , G06F40/30 , G06F40/247 , G06F40/242
Abstract: 本发明公开了一种国防科技领域开源信息置信度确定方法及系统。所述方法通过对国防科技领域已有开源信息进行命名实体识别和属性抽取,提取出相应的命名实体和对应的属性;再通过实体统一和实体消歧技术对命名实体和对应属性做进一步的判别更正,提高实体和属性抽取的准确性。在实际使用时,通过对同一实体同一属性在不同资讯来源的相互印证,计算出该开源信息的置信度以及信息源的置信度,为国防科技领域用户提供更加准确的信息服务。
-
公开(公告)号:CN109522396B
公开(公告)日:2020-12-25
申请号:CN201811226250.1
申请日:2018-10-22
Applicant: 中国船舶工业综合技术经济研究院
IPC: G06F16/332 , G06F16/36 , G06F40/295
Abstract: 本发明公开一种面向国防科技领域的知识处理方法及系统。所述知识处理方法包括:获取国防科技领域的多个文本资料;从所述文本资料中提取初始的知识本体;所述初始的知识本体为三元组集合,每一个三元组都包括实体、关系和描述三个元素;对所述多个文本资料进行分词,得到多个词段;对于每个所述词段,确定对应的词段组合;将共现概率大于设定概率阈值的词段组合,确定为新的知识本体;将所述新的知识本体补充入所述初始的知识本体中,形成更新后的知识本体;所述更新后的知识本体用于国防科技领域智能问答时使用。采用本发明的知识处理方法,对国防科技领域的知识实现了系统的处理,构建了完整的知识本体,实现了国防科技领域的智能问答。
-
公开(公告)号:CN111738022A
公开(公告)日:2020-10-02
申请号:CN202010578821.9
申请日:2020-06-23
Applicant: 中国船舶工业综合技术经济研究院
IPC: G06F40/58 , G06F40/284 , G06F40/289
Abstract: 本发明涉及一种国防军工领域机器翻译优化方法及系统。所述方法包括:提取待翻译文章的关键词,得到关键词列表;计算所述关键词列表中每个关键词与对应上下文的词向量;由词向量计算关键词对的余弦相似度;根据余弦相似度对关键词列表中的所有关键词进行层次聚类,得到多个词类别;采用机器翻译模型对各词类别的中的所有关键词进行翻译,得到用户译法。本发明的目的是提供一种国防军工领域机器翻译优化方法及系统,以确保整篇文章中关键词的翻译一致性,提高翻译质量。
-
公开(公告)号:CN110287302A
公开(公告)日:2019-09-27
申请号:CN201910572637.0
申请日:2019-06-28
Applicant: 中国船舶工业综合技术经济研究院
IPC: G06F16/332 , G06F16/36 , G06F17/27
Abstract: 本发明公开了一种国防科技领域开源信息置信度确定方法及系统。所述方法通过对国防科技领域已有开源信息进行命名实体识别和属性抽取,提取出相应的命名实体和对应的属性;再通过实体统一和实体消歧技术对命名实体和对应属性做进一步的判别更正,提高实体和属性抽取的准确性。在实际使用时,通过对同一实体同一属性在不同资讯来源的相互印证,计算出该开源信息的置信度以及信息源的置信度,为国防科技领域用户提供更加准确的信息服务。
-
公开(公告)号:CN110162791B
公开(公告)日:2023-04-07
申请号:CN201910438831.X
申请日:2019-05-24
Applicant: 中国船舶工业综合技术经济研究院
IPC: G06F40/289 , G06F40/216 , G06F16/33 , G06F16/38
Abstract: 本发明公开了一种面向国防科技领域的文本关键词提取方法及系统。所述方法通过大量样本训练出一套能从国防科技某一领域的文本中精准提取能表征文章主要内容的关键词的机器处理机制,训练样本的质与量保证了关键词提取的正确性与权威性,完整的训练方法保证了提取过程改善的持续性。采用本发明方法提取的关键词是根据其指代的概念特征提取的,即便其本身可能并未在文章中出现,但仍能够通过语义特征准确反映文章主题,从而解决了基于词频方法提取关键词不够准确、检索命中率不高的问题。
-
公开(公告)号:CN113936282A
公开(公告)日:2022-01-14
申请号:CN202111221209.7
申请日:2021-10-20
Applicant: 中国船舶工业综合技术经济研究院
IPC: G06V30/24 , G06V30/196 , G06V30/148 , G06V10/764 , G06V10/75
Abstract: 本发明实施例提供一种面向军工科研生产数据的字符识别方法包括:获取基于预处理后的军工科研生产数据,采用文本检测技术框选出图像的文本区域,对文本区域进行字符识别后输出的每个字符的初始识别结果以及识别准确率;获取被抽取字符所对应的文本区域的初始图像,基于预设判别标准,通过预设辨别模块初始图像进行判别;若预设辨别模块的判别结果与初始识别结果一致,则确定初始识别结果正确;若预设辨别模块的判别结果与初始识别结果不一致,则确定初始识别结果错误;被抽取字符的抽取概率基于文档识别要求、字符数量、每个字符的识别准确率以及识别错误频次确定。结合文档识别要求和字符的识别准确率,随机抽取字符下进行识别,提升校对效率。
-
公开(公告)号:CN110334269B
公开(公告)日:2021-05-07
申请号:CN201910622980.1
申请日:2019-07-11
Applicant: 中国船舶工业综合技术经济研究院
IPC: G06F16/953 , G06F16/9538
Abstract: 本发明公开一种信息检索方法及系统。本发明提供的信息检索方法及系统,首先计算待查找关键词集合与国防科技情报领域待查数据源的网页文档集合中各个网页文档的相关性;然后将相关性大于或者等于相似阈值的网页文档输出,并将相关性小于相似阈值的网页文档按照时序性由高到低的顺序输出。本发明提供的检索方法及系统,将相关性较大的网页文档作为检索结果输出,能够确保检索结果的覆盖率,同时,对于相关性较小的网页文档,按照其时序性由高到低的顺序输出给用户,能够满足资讯检索的高时效性要求。因此,采用本发明提供的方法及系统进行国防科技情报领域的信息检索,能够同时满足其高时效性和高覆盖率的要求。
-
-
-
-
-
-
-
-
-