一种适用于多个隐混杂因子数据的发现方法及系统

    公开(公告)号:CN109325600A

    公开(公告)日:2019-02-12

    申请号:CN201811125577.X

    申请日:2018-09-26

    Abstract: 本发明公开了一种适用于多个隐混杂因子数据的因果网络发现方法及系统,该系统包括:用户输入数据模块、参数配置模块、因果骨架学习模块、局部因果顺序识别模块、隐混杂因子检测模块、因果网络构建模块、结果可视化模块。适用于多个隐混杂因子数据的因果网络发现系统能够根据用户的需求进行因果网络发现,然后可视化地呈现出观察变量间的因果网络。本发明考虑了多个隐混杂因子的情况,利用因果骨架的信息大大降低求解的复杂度,同时检测出隐混杂因子的个数及其影响的观察变量,使因果网络的学习和识别正确率高,解决了在含有多个隐混杂因子数据的情况下无法正确发现因果网络的问题。本发明实施简单,学习准确率高,具有很强的实际价值和现实意义。

    一种面向时序隐变量的因果结构发现方法

    公开(公告)号:CN108985460A

    公开(公告)日:2018-12-11

    申请号:CN201810674146.2

    申请日:2018-06-27

    Abstract: 本发明涉及一种面向时序隐变量的因果结构发现方法,通过基于变分推断和蒙特卡洛抽样发现因果结构、交叉验证确定因果滞后影响长度两个过程,从而输出观察变量之间的因果网络结构和因果滞后影响长度。本发明考虑了先验知识,融合贝叶斯推断思想,采用变分推断将难以求解的问题进行了转换,化为容易求解的问题,因果网络结构和因果滞后影响长度识别正确率高,能够在含有隐变量的情况下,利用因果关系发现和贝叶斯推断的思想,从超参角度出发,发现观察变量之间的因果结构;同时,将隐变量视为参数的一部分,利用变分推断的方法来近似求解参数的最大后验概率,降低了复杂度,但依然使其有较好的优化效果,能够保持很高的识别率。

    一种融合多类型信息的网络表示方法

    公开(公告)号:CN107291803A

    公开(公告)日:2017-10-24

    申请号:CN201710337894.7

    申请日:2017-05-15

    CPC classification number: G06F16/20

    Abstract: 本发明提供一种融合多类型信息的网络表示方法,包括:步骤1,读取网络结构信息及节点属性信息;步骤2,将所述节点属性信息转换为向量;步骤3,利用降维技术对所述向量进行降维,生成属性特征向量;步骤4,根据所述网络结构信息,生成对应的矩阵G(V,E),其中V表示节点集合,E表示边集合;步骤5,初始化所述节点属性特征向量;步骤6,利用随机游走和滑动窗口方法构建训练样本;步骤7,调整节点向量值,以获得最大化条件概率;步骤8,输出调整后的节点向量作为网络表示。本发明能够高效地融合网络中的多种类型信息,学习到的网络表示可以用于复杂网络的理解挖掘。

    一种基于产品信息结构化的Web问答检索系统

    公开(公告)号:CN103440287B

    公开(公告)日:2016-12-28

    申请号:CN201310354888.4

    申请日:2013-08-14

    Abstract: 本发明是一种基于产品信息结构化的Web问答检索系统。包括用户接口、产品信息爬取模块、信息抽取模块、倒排索引建立模块、数据库接口、信息整合模块、问句处理模块、数据库,本发明能实时获得线上产品信息的最新情况,并通过信息抽取和整合模块,能够及时对数据库中已有的结构化产品数据进行更新或增加新的结构化产品数据,使得系统能够适应线上产品信息的变化。另外,本发明从多个产品信息网站对产品信息进行采集,并通过信息抽取和整合模块,对同一产品在不同网站上的产品信息进行整合,对矛盾的信息进行判断,对缺少的信息进行不同信息源间的互补,确保检索信息的完整性和真实性。本发明是一种具有较高的检索效率的基于产品信息结构化的Web问答检索系统。

    面向专业文献知识实体的类型抽取系统及方法

    公开(公告)号:CN106156286A

    公开(公告)日:2016-11-23

    申请号:CN201610488849.7

    申请日:2016-06-24

    Abstract: 本发明公开了一种面向专业文献知识实体的类型抽取系统,该系统包括:用户查询及反馈接口、在线爬虫及管理模块、知识实体识别模块、知识实体的类型抽取模块、类型标签传播及索引库建立模块、知识实体类型关系图模型构建模块、数据可视化模块。本发明系统能够根据用户查询的实体关键词进行实体类型抽取,然后可视化地呈现出知识实体之间的类型关系、层次关系和时序演变模式。另外,本发明还提出的一种面向专业文献知识实体的类型抽取方法,本发明方法可以有效的对专业领域的知识实体进行类型标签抽取,解决了人工预定义类型的局限性和主观性的问题,有助于专业知识网络的结构化实现。

    基于递归神经网络建模的无监督人群异常监测及定位方法

    公开(公告)号:CN106022244A

    公开(公告)日:2016-10-12

    申请号:CN201610322129.3

    申请日:2016-05-16

    Abstract: 本发明公开了基于递归神经网络建模的无监督人群异常监测及定位方法,该方法利用监控视频的时间序列特性与递归神经网络长时间依赖性相结合,并在对视频场景进行网格划分后,针对每个网格进行单独建模,选择性的利用光流统计特征对正常情况下人群序列动态进行无监督的学习,并采用Hessian‑Free Optimization方法对模型进行训练,最后将含有异常的数据载入模型,通过衡量t+1时刻与t时刻光流统计直方图之间的距离,对t+1时刻的人群场景进行监测和定位。该方法实现了时间和空间上的全局建模,很好的保留了各时刻人群动态序列特征之间的联系,且简化了模型的复杂度,降低了RNN训练难度,对异常事件的监测和定位有着较好的实时性和准确性。

    基于Storm的产品评论信息实时采集方法

    公开(公告)号:CN106021391A

    公开(公告)日:2016-10-12

    申请号:CN201610313091.3

    申请日:2016-05-11

    CPC classification number: G06F16/951

    Abstract: 本发明公开了基于Storm的产品评论信息实时采集方法,该方法在基于Storm平台的采集系统进行,该方法包括产品抓取模块周期性的从网络中抓取数据,预处理模块根据产品Id初始化产品的属性参数,调度模块将数据封装成Tuple发射到Storm集群中,更新检测模块检查是否有新的评论产生,将其送到评论信息抓取模块,评论信息抓取模块检测到有评论信息更新的产品进行分布式抓取,访问间隔调整模块动态调整产品下一次采集的时间等。本发明将传统的网络爬虫与开源分布式流处理框架Storm相结合,使得传统的网络爬虫能够运行在流处理平台上,在实时信息采集性能上得到极大提高,具有很强的实际价值和现实意义。

    一种基于位置服务的旅游推荐方法

    公开(公告)号:CN105550950A

    公开(公告)日:2016-05-04

    申请号:CN201510819258.9

    申请日:2015-11-20

    Abstract: 本发明提出了一种基于位置服务的旅游推荐方法,包括步骤1,获取实体轨迹-事件信息,以三维张量对实体信息进行用户-位置-活动关联建模;步骤2,记录用户轨迹-事件信息,步骤3,通过用户类比进行相似度匹配,主动推送较高相似度用户轨迹-事件信息,其中,用户轨迹-事件信息(来自于手机、运动手环、运动手表的位置信息)整合后,匹配相关用户轨迹-事件信息,并实施推送。本发明提出的方法,为集成海量用户数据并用协同过滤算法在不同位置找出相似的用户和活动,用张量对用户-位置-活动之间的相互关系建模并提出一个正则化张量/矩阵分解算法,该算法可以有效缓解单个用户移动位置数据的稀疏性问题,挖掘用户的移动模式。

    一种基于位置服务的社交关系推断方法以及服务器

    公开(公告)号:CN105427173A

    公开(公告)日:2016-03-23

    申请号:CN201510793720.2

    申请日:2015-11-18

    CPC classification number: G06Q50/01 G06F16/9537

    Abstract: 一种基于位置服务的社交关系推断方法以及服务器。其中,该方法包括以下步骤:记录用户登录社交应用时的用户名、登录地点和登录时间;判断任意两个登录地点相同的用户的登录时间之差是否处于预定时间间隔之内;若处于,设定该两个用户的相会向量 ;建立用户i与用户j的相会地点多样性函数;建立加权相会频率函数;对相会地点多样性函数和加权相会频率函数做线性回归,得到用户i与用户j的社交关系。本申请综合考虑了相会地点的多样性和加权相会频率,相会地点的多样性减少了偶遇对社交关系的影响,而加权相会频率增加了特定位置对社交关系的影响,因此,本申请所推断的社交关系更加准确。

    一种提升推荐系统准确性的方法

    公开(公告)号:CN105205130A

    公开(公告)日:2015-12-30

    申请号:CN201510585579.7

    申请日:2015-09-15

    CPC classification number: G06F16/9535 G06Q30/0251 G06Q30/0277

    Abstract: 本发明公开了一种提升推荐系统准确性的方法,首先构建三个数据子集,然后在构建的数据子集上分别应用本发明构建的基于高斯混合分布的评分模型,标记各个数据子集中的无标签数据,获得各个教练集,并将获得的教练集中被标记的原始无标签数据加入到其他子集中的有标签数据,迭代更新其他子集中原始无标签数据的标签,最后输出最终推荐结果。该方法使推荐系统可以有效对抗评分噪声,获得了良好鲁棒性,提升了推荐准确率。此外,还可以有效缓解冷启动问题。

Patent Agency Ranking