-
公开(公告)号:CN111259658A
公开(公告)日:2020-06-09
申请号:CN202010080710.5
申请日:2020-02-05
Applicant: 中国科学院计算技术研究所
IPC: G06F40/279 , G06F40/216 , G06K9/62
Abstract: 本发明提出一种基于类别稠密向量表示的通用文本分类方法及系统,包括:获取包括以标记类别文本的训练数据,使用全连接网络处理该训练数据,得到各类别的类别稠密向量;将待分类文本输入至深度神经网络,得到该待分类文本中每个词的词稠密向量,并集合该词稠密向量得到该待分类文本的文本稠密向量;将该文本稠密向量和该类别稠密向量输入至匹配度测量模型,得到该待分类文本属于各类别的概率分布,将该待分类文本与该概率分布中概率最大的类别相匹配,作为该待分类文本的分类结果。本发明基于类别稠密向量表示,将文本分类问题转化为文本匹配问题,通过计算输入文本与每个类别之间的匹配程度,将文本分到匹配程度最大的类别之中。
-
公开(公告)号:CN107391577B
公开(公告)日:2020-04-03
申请号:CN201710469315.4
申请日:2017-06-20
Applicant: 中国科学院计算技术研究所
IPC: G06F16/9535 , G06F16/78 , G06F16/735
Abstract: 本发明涉及一种基于表示向量的标签推荐方法和系统,其特征在于,包括:获取多个作品,根据每个作品对应的标签、关系及对象,构建多个包含作品和标签的二元组信息和包含作品、关系及对象的三元组信息,根据二元组信息和三元组信息生成训练数据集;通过对训练数据集进行表示学习,分别得到各个作品的作品表示向量和各类标签的标签表示向量;通过计算各个作品表示向量和各类标签表示向量之间的距离,从各类标签中筛选出各个作品的推荐标签。本发明在学习表示向量的过程中,本发明同时考虑作品标签对二元组信息和作品的三元组信息。通过融入更多信息,使得学到的表示向量能够更准确地反映作品和标签的语义,从而更好地支持标签推荐这一任务。
-
公开(公告)号:CN110781367A
公开(公告)日:2020-02-11
申请号:CN201910909270.7
申请日:2019-09-25
Applicant: 中国科学院计算技术研究所
IPC: G06F16/951 , G06F16/955
Abstract: 本发明提出一种基于中间人的互联网数据采集方法及系统,包括:通过安装中间人代理证书至网页信息采集设备,建立网页信息采集设备的中间人,网页信息采集设备访问互联网中网页信息时,中间人代理网页信息采集设备的全部网络流量;中间人获取包含待采集网页URL正则表达式的采集任务,捕获全部网络流量中符合URL正则表达式的流量,作为中间流量,并将采集任务注入中间流量的HTML页面中,得到待解析页面并将其存入第一数据库;解析模块根据第一数据库中待解析页面的URL信息,将待解析页面分发给解析器实例进行解析,从中获取包含结构化数据的网页采集结果并将其存入第二数据库。本发明能够支持所有依靠集成浏览器内核功能来提供信息的应用的数据采集。
-
公开(公告)号:CN110705597A
公开(公告)日:2020-01-17
申请号:CN201910833900.7
申请日:2019-09-04
Applicant: 中国科学院计算技术研究所
IPC: G06K9/62 , G06F16/953
Abstract: 本发明提出一种基于事件因果关系抽取的网络苗头事件检测方法及系统,包括:将苗头因果事件对中原因事件作为苗头事件,存入苗头事件样本库,以苗头事件样本库的数据作为训练集,训练基于机器学习的第一苗头事件分类器,并将苗头因果事件对的因果联系作为苗头事件判定规则,存入苗头事件判定规则库,以苗头事件判定规则库构建基于规则的第二苗头事件分类器;对指定的网络平台进行事件抽取,得到多个结构化事件,并将多个结构化事件中指代同一个事件的结构化事件统一为一个共指事件,并对共指事件进行泛化,得到网络平台的抽象事件,使用第一苗头事件分类器和第二苗头事件分类器分别处理抽象事件,综合两者的结果作为网络平台苗头事件的检测结果。
-
公开(公告)号:CN110557428A
公开(公告)日:2019-12-10
申请号:CN201910646748.1
申请日:2019-07-17
Applicant: 中国科学院计算技术研究所
Abstract: 本发明涉及一种基于Kubernetes的脚本解释型服务代理方法和系统,该方法包括:设置一客户端,用于生成代理脚本并作为服务请求;设置一Kubernetes系统,并在该Kubernetes系统中部署若干服务;设置一服务执行单元,用于处理该服务请求,并返回处理结果至该客户端;该方法包括:函数绑定步骤,该服务执行单元根据一预设协议,定期查询API SERVER,获取该Kubernetes系统中的服务,并为每一服务绑定一函数名称;服务调用步骤,该服务执行单元接收并解析执行该客户端发送的该服务请求中的代理脚本,并在执行脚本的过程中,依据函数名调用Kubernetes中的服务。本发明有效解决了复杂服务以及远程和不可靠环境下的访问问题。
-
公开(公告)号:CN110532072A
公开(公告)日:2019-12-03
申请号:CN201910672072.3
申请日:2019-07-24
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种基于微内核操作系统的分布式流式数据处理方法及系统,包括:获取包含用户定义函数的作业代码,并以该用户定义函数作为节点将该作业代码转换为有向无环图,并根据该有向无环图中算子之间的关联度,将该有向无环图中算子进行合并,得到任务逻辑视图;根据分布式微内核操作系统的物理执行环境,将该任务逻辑视图转换为执行图,该分布式微内核操作系统中工作节点收到该执行图,并将该执行图内的作业任务与作业调度分配至空闲CPU内核执行。与现有技术相比,本发明具有端到端处理延迟低,且吞吐量高,系统镜像体积小,启动时间短的技术进步。
-
公开(公告)号:CN110232113A
公开(公告)日:2019-09-13
申请号:CN201910292426.1
申请日:2019-04-12
Applicant: 中国科学院计算技术研究所
IPC: G06F16/332 , G06F16/33 , G06F17/27
Abstract: 本发明提出一种提高知识库问答准确度的方法及系统,包括:获取待回答的用户问句,提取该用户问句中的主题实体,以该主题实体检索知识库,将得到的每一个候选答案的路径信息作为候选路径,并预处理该用户问句,得到该用户问句的向量表示;利用该向量表示对该候选路径上的每一步关系利用注意力机制进行打分,得到该候选路径上的每一步关系的关系置信度,并将该候选路径上所有的关系置信度求和,得到关系路径的路径置信度;将所有候选路径根据其置路径置信度进行排序,输出路径置信度最高的候选路径作为该用户问句的回答结果。本发明增强了中间结点在整个关系推断中的作用,提高了关系推断的准确率。
-
公开(公告)号:CN110188265A
公开(公告)日:2019-08-30
申请号:CN201910343595.3
申请日:2019-04-26
Applicant: 中国科学院计算技术研究所
IPC: G06F16/9535 , G06F16/335
Abstract: 本发明涉及一种融合用户画像的网络舆情热点推荐方法,包括:根据用户的倾向信息生成用户画像,并获得用户热度;根据当前网络舆情信息的固有属性,生成网民热度;以该用户热度和该网民热度获得针对该用户的网络舆情热点推荐度,并根据该推荐度向该用户推荐网络热点信息。本发明的融合用户画像的网络舆情热点推荐方法,将用户画像与网民热度挖掘作为独立的模块,可以分别得到不同的推荐结果,同时这种松耦合的机制可以增强系统的可扩展性和可移植性。对于不同的用户,其用户画像表示可扩展现有系统不存在的特殊需求,不影响系统整体架构,复用性高,开发成本低,支持冷启动。
-
公开(公告)号:CN109815382A
公开(公告)日:2019-05-28
申请号:CN201811634238.4
申请日:2018-12-29
Applicant: 中国科学院计算技术研究所
IPC: G06F16/951
Abstract: 本发明涉及一种大规模网络数据的感知与获取方法,包括:感知网络数据的信息来源并将其拆分为信源,对该信源设置采集策略;生成采集任务,注册采集节点,以该注册节点拉取采集器并对其进行配置;根据该采集策略,通过该采集器执行该采集任务,获取结构化数据;监控该采集任务的执行状态,统计该结构化数据,并将监控结果和统计结果发送给用户。本发明的大规模网络数据感知与获取系统,按照不同的功能逻辑,划分为采集子平台、调度子平台、信源管理与配置子平台和监控与统计子平台,本系统是集大规模网络数据的感知发现、多信息来源的网络数据获取、高质量信息抽取及用户友好性交互界面于一体的通用大规模网络数据感知系统。
-
公开(公告)号:CN109684349A
公开(公告)日:2019-04-26
申请号:CN201811383695.0
申请日:2018-11-20
Applicant: 中国科学院计算技术研究所
IPC: G06F16/242 , G06F16/245
Abstract: 本发明涉及一种基于SQL与图计算交互式分析的查询方法和系统,包括:根据标准结构化查询语句对数据库中的节点表和边表进行筛选,得到原始节点集和原始边集,根据类结构化查询语句涉及的图计算算法将原始边集转换为图计算算法所需数据结构,原始节点集和原始边集进行连接查询的迭代计算,不断更新节点集,直至算法的迭代终止条件触发,从而得到图计算的最终结果,并将最终结果作为查询结果输出。本发明在已有的关系型数据查询语言SQL中嵌入图查询与图计算方法,既可发挥SQL数据处理与分析的优势,又可进行图查询与计算。
-
-
-
-
-
-
-
-
-