-
公开(公告)号:CN109753596B
公开(公告)日:2021-05-25
申请号:CN201811637397.X
申请日:2018-12-29
Applicant: 中国科学院计算技术研究所
IPC: G06F16/95
Abstract: 本发明涉及一种网络数据采集的信源管理与配置方法,包括:感知网络数据的信息来源,将该信息来源拆分为传媒、信簇和信源;根据信簇类别对该信簇进行类别标注;根据信源类别对该信源进行类别标注;根据该信源的信源类别配置采集模板;根据该信源所包含的网络数据配置抽取模板;当验证该信源为潜在失效信源时,将该信源置为无效,或重新配置该采集模板和/或该抽取模板。本发明的信源管理与配置系统,通过“传媒‑信簇‑信源”三级结构的分层概念体系和多维度的信息来源分类体系对来自不同类型的信息来源进行合理高效组织,进而实现对大规模网络信息来源的精确感知并设计采集策略。
-
公开(公告)号:CN112287274A
公开(公告)日:2021-01-29
申请号:CN202011162449.X
申请日:2020-10-27
Applicant: 中国科学院计算技术研究所
IPC: G06F16/958 , G06F16/35 , G06F16/957 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种网站列表页面的分类方法,方法包括:步骤100,获取一组网站页面集合,网站页面集合归属于同一网站;步骤200,分别针对每一网站页面提取网页数据特征;步骤300,通过网站页面的超链接列表以及网站网页的链接地址(URL)与节点编号之间的匹配关系形成的哈希表,创建网站的全局拓扑结构;步骤400,将网页数据特征以及网站的全局拓扑结构输入图卷积神经网络进行图卷积神经网络的训练,得到网站列表页面分类器;步骤500,获取待分类的网站网页,分别根据待分类的网站网页的网页数据特征和网站的全局拓扑结构,并将待分类的网站网页的网页数据特征和网站的全局拓扑结构输入网站列表页面分类器,判断该待分类的网站网页是否为网站列表页面。
-
公开(公告)号:CN109828995B
公开(公告)日:2020-12-11
申请号:CN201811533324.6
申请日:2018-12-14
Applicant: 中国科学院计算技术研究所
IPC: G06F16/2458 , G06F16/28 , G06K9/62
Abstract: 本发明涉及一种基于视觉特征的图数据检测方法和系统,包括:获取待分析的图数据,并统计该图数据的分布特征;将该分布特征输入基于视觉特征的分类模型,得到该图数据中具有相同类别的节点,通过将类别相同的该节点划分至同一分组,得到多个分组;利用基于视觉的分析模型对该分组进行聚合分析,得到每个分组的聚类特征,根据每个分组的该聚类特征进行模式总结和异常检测处理,并将每个分组的该聚类特征、模式总结结果和异常检测结果作为该图数据的检测结果。本发明不直接对大图数据的邻接矩阵或者拉普拉斯矩阵进行分解操作,处理速度快,效率高,具有更强的及时性。
-
公开(公告)号:CN111291229A
公开(公告)日:2020-06-16
申请号:CN202010071390.7
申请日:2020-01-21
Applicant: 中国科学院计算技术研究所
IPC: G06F16/901 , G06F16/9035 , G06Q40/04
Abstract: 本发明提出一种基于稠密多部子图的检测方法及系统,包括:步骤1、根据链式特征中的信息流动,构建交易网络的多部图,根据预设的账户间信息流动阈值筛选该多部图,得到该多部图中的稠密子图;步骤2、以固定账户存在超阈值的信息流且在中间账户中保留低于阈值的权重为约束条件,生成该稠密子图中节点子集的异常值;步骤3、根据该异常值,输出该多部图中存在异常行为的节点子集作为异常行为检测结果。本发明通过具有有效性和鲁棒性和良好的可扩展性。
-
公开(公告)号:CN106874489B
公开(公告)日:2020-05-12
申请号:CN201710092869.7
申请日:2017-02-21
Applicant: 烟台中科网络技术研究所 , 中国科学院计算技术研究所
Abstract: 本发明涉及一种基于卷积神经网络的肺结节图像块检索方法及装置,通过对获取的肺结节图像块进行切片处理,得到至少两张肺结节切片扫描图,通过构造卷积神经网络提取肺结节切片扫描图的图像特征,得到肺结节的局部特征集合,获取数据库中所有肺结节的局部特征集合,对所有肺结节的局部特征集合进行聚类构建视觉词典,基于视觉词典获取肺结节带权特征向量,通过倒排索引的方式对肺结节带权特征向量构建索引库,根据输入的查询信息对索引库执行检索,得到符合查询条件的肺结节图像块。本发明能够快速、准确的检索出与待检索肺结节最相似的肺结节图像序列。
-
公开(公告)号:CN111062214A
公开(公告)日:2020-04-24
申请号:CN201911166642.8
申请日:2019-11-25
Applicant: 中国科学院计算技术研究所
IPC: G06F40/295 , G06F40/211 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明提出一种基于深度学习的集成实体链接方法及系统。首先选取某一个局部相似度模型,对待链接文档给出初步的链接结果。随后,根据每个指称词相应候选实体集合的局部相似度得分,候选实体集合生成方法本发明不加以限制,可采用现有任意候选实体生成方法;局部相似度得分即所选用的局部相似度模型对每个候选实体计算出来的相似度得分,按照下述方法计算每个指称词的有效候选实体集合表达向量。结合全局推断算法,利用指称词所在的文档的文本信息和同一文档中指称词之间的相互关联性完成实体链接任务。本发明利用同一文档中指称词之间的相互关联丰富指称词的语义信息,能够更好地辨别指称词的含义,达到良好的实体链接性能。
-
公开(公告)号:CN110533162A
公开(公告)日:2019-12-03
申请号:CN201910677639.6
申请日:2019-07-25
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种自动生成深度学习框架间操作映射的方法及系统,包括:根据原深度学习框架和目标深度学习框架间的操作转换规则,抽取框架间操作转换的基本共性,根据基本共性构建转换关系,将转换关系作为基类存储于操作转换的初始描述文件中;获得原深度学习框架下支持的操作集合,遍历操作集合,为每个操作构建继承基类的子类,判断操作集合中操作除了基类中的基本转换规则外是否具有特殊属性,若是则补充特殊属性至子类,构成完备描述文件,否则直接保存子类,构成完备描述文件;将完备描述文件输入至编译器,得到操作转换规则,根据操作转换规则将原深度学习框架下待转换的操作转换为目标深度学习框架下的操作。
-
公开(公告)号:CN109992629A
公开(公告)日:2019-07-09
申请号:CN201910149696.7
申请日:2019-02-28
Applicant: 中国科学院计算技术研究所
IPC: G06F16/28
Abstract: 本发明涉及一种融合实体类型约束的神经网络关系抽取方法及系统,包括对实体类型施加注意力机制,该机制对实体的多种类型分配了不同权重,从而凸显了影响最大的类型标签;在损失函数中添加实体类型约束函数,该约束函数在更新过程中使实体词向量学习到实体类型信息,从而实现实体类型对关系的约束。该技术增强了模型对通用方法无法区别关系的识别能力。
-
公开(公告)号:CN109889452A
公开(公告)日:2019-06-14
申请号:CN201910012933.5
申请日:2019-01-07
Applicant: 中国科学院计算技术研究所
IPC: H04L12/851 , H04L12/24 , H04L12/26 , H04L1/00
Abstract: 本发明涉及一种基于条件生成式对抗网络的网络背景流量生成方法,包括:数据获取步骤,获取的网络流量数据及条件信息,并向量化为真实流量;模型生成步骤,以该真实流量得到初始生成模型和判别模型,并通过条件生成式对抗网络以该判别模型对该初始生成模型进行训练,以得到生成模型;流量生成步骤,通过该生成模型以随机向量生成模拟背景流量。
-
公开(公告)号:CN109840298A
公开(公告)日:2019-06-04
申请号:CN201811637902.0
申请日:2018-12-29
Applicant: 中国科学院计算技术研究所
IPC: G06F16/951 , G06F16/955
Abstract: 本发明涉及一种大规模网络数据的多信息来源采集方法,包括:获取多种传媒上的网络数据所在的信源;生成采集任务,启动并初始化采集节点上的采集器;将该采集任务的参数配置信息加载至该采集器;以该采集器获取该信源的目标信息内容链接,并建立链接队列;以该采集器依次采集该链接队列中对应的目标信息内容为结构化数据;将该结构化数据进行持久化操作,并进行输出。本发明提出的方法可以感知信息来源的变化,能够定点定主题的获取信息来源的网络数据,并且具有泛化能力,采集能力与传媒种类无关。
-
-
-
-
-
-
-
-
-