-
公开(公告)号:CN109657114B
公开(公告)日:2023-11-03
申请号:CN201810953361.6
申请日:2018-08-21
申请人: 国家计算机网络与信息安全管理中心 , 中科国力(镇江)智能技术有限公司
IPC分类号: G06F16/951 , G06F16/9535 , G06F16/81
摘要: 本发明公开了一种抽取网页半结构化数据的方法,包括:从web站点爬取页面;人工定制化爬取目标页的url;配置一类网站的关键词词根;对类似的网页进行分析,根据case1,case2,case3进行分类判别,并对复杂的嵌套情况加以处理,抽取出网页模板。通过指定的url选出同类(栏目)url,同栏目url对应的html文本结构相似,遍历所有html节点,通过节点间的联系或节点本身,发现对应关键词的模板。从一个网站的所有子url中,找出和人工给定的相似的url。把目标格式分为case1,case2,case3,三种情况,对每一种情况分别进行处理,生成网页模板。
-
公开(公告)号:CN109657114A
公开(公告)日:2019-04-19
申请号:CN201810953361.6
申请日:2018-08-21
申请人: 国家计算机网络与信息安全管理中心 , 中科国力(镇江)智能技术有限公司
IPC分类号: G06F16/951 , G06F16/9535 , G06F16/81
摘要: 本发明公开了一种抽取网页半结构化数据的方法,包括:从web站点爬取页面;人工定制化爬取目标页的url;配置一类网站的关键词词根;对类似的网页进行分析,根据case1,case2,case3进行分类判别,并对复杂的嵌套情况加以处理,抽取出网页模板。通过指定的url选出同类(栏目)url,同栏目url对应的html文本结构相似,遍历所有html节点,通过节点间的联系或节点本身,发现对应关键词的模板。从一个网站的所有子url中,找出和人工给定的相似的url。把目标格式分为case1,case2,case3,三种情况,对每一种情况分别进行处理,生成网页模板。
-
-
公开(公告)号:CN111711532B
公开(公告)日:2022-10-04
申请号:CN202010367188.9
申请日:2020-04-30
申请人: 国家计算机网络与信息安全管理中心
IPC分类号: H04L41/0213 , H04L41/0803
摘要: 一种异构网络设备的统一管理方法,可以将不同厂商不同型号具有不同结构、不同管理能力及管理方式的网络设备进行统一管理。通过定义统一的管理模型,明确了不同网络设备配置场景所需要的参数及方法,并具备扩展能力实现更多配置场景。本发明的方法相比于目前基于命令行的方式大幅度提升了管理效率,减轻可管理员维护负担,并基于QVT可实现分析规划能力,实现运维自动化及智能化。
-
公开(公告)号:CN111711532A
公开(公告)日:2020-09-25
申请号:CN202010367188.9
申请日:2020-04-30
申请人: 国家计算机网络与信息安全管理中心
IPC分类号: H04L12/24
摘要: 一种异构网络设备的统一管理方法,可以将不同厂商不同型号具有不同结构、不同管理能力及管理方式的网络设备进行统一管理。通过定义统一的管理模型,明确了不同网络设备配置场景所需要的参数及方法,并具备扩展能力实现更多配置场景。本发明的方法相比于目前基于命令行的方式大幅度提升了管理效率,减轻可管理员维护负担,并基于QVT可实现分析规划能力,实现运维自动化及智能化。
-
-
公开(公告)号:CN109684452A
公开(公告)日:2019-04-26
申请号:CN201811587178.5
申请日:2018-12-25
申请人: 中科国力(镇江)智能技术有限公司
IPC分类号: G06F16/332 , G06F16/35 , G06F17/27 , G06N3/04
CPC分类号: G06F17/2735 , G06N3/0445 , G06N3/0454
摘要: 本发明公开了一种基于答案与答案位置信息的神经网络问题生成方法,神经网络模型是序列到序列的,由编码器与解码器两部分构成。编码器模型主要学习原文中的特征,解码器用于使用上述特征生成对应答案的问题句。完整的一条问题句的生成过程分为三个模式:问题词生成模式,词典词生成模式与拷贝模式。其中,问题词生成模式使用基于答案的模型,通过与答案在原文中的位置信息无关的上下文向量参与模型计算,从限定的问题词词典中生成与答案对应的问题词;问题词生成模式采用与答案在原文中的位置信息有关的上下文向量进行计算;拷贝模式的概率分布直接使用与答案在原文中的位置信息有关的注意力分布。
-
-
-
-
-
-