基于规则模型的实体抽取与关系挖掘构建知识图谱的方法

    公开(公告)号:CN106874378A

    公开(公告)日:2017-06-20

    申请号:CN201710006826.2

    申请日:2017-01-05

    Abstract: 本发明涉及一种基于规则模型的实体抽取与关系挖掘构建知识图谱的方法,步骤一:爬取目标领域的百科知识库数据,并定义食品类、农药类、营养类、病虫害类字典,便于规则挖掘;步骤二:对百科类数据进行去HTML标签化,获取中文文本并获取URL链接,便于后续处理;步骤三:通过加入人工标注的关系属性信息,来获取更全的实体属性信息;步骤四:对事件的获取以及图谱关系建立。本发明将文本信息转换成词向量数学信息,然后进行向量相似度比较,并根据数字间的关系,来标注实体间的关系,为用户展现出该领域的核心知识库,并提高优化搜索质量,实现了从简单字符串到实体理解的过程。

    基于频繁子树的社交网络马甲识别模型的方法

    公开(公告)号:CN106598954A

    公开(公告)日:2017-04-26

    申请号:CN201710007000.8

    申请日:2017-01-05

    CPC classification number: G06F17/271 G06F2216/03

    Abstract: 本发明涉及一种基于频繁子树的社交网络马甲识别模型的方法,步骤一:获取微博文本数据。步骤二:数据预处理:步骤三:利用依存句法分析软件,对微博文本进行依存句法分析,每条微博会得到一个句法分析结果。步骤四:将步骤三得到的依存句法树采用Pre‑Order‑String方法表示。步骤五:某人的微博列表中的每个文本利用步骤四的方法得到分析结果;步骤六:将需要判断是否为马甲关系的两个账号分别按照步骤一至五,得到两个马甲账号的频繁依存句法树。本发明所提供的一种基于频繁子树的社交网络马甲识别模型的方法,通过大量的数据训练之后,可以将方法利用在社交网站对于网络安全的管理以及政府关于网络犯罪的追查,能够快速,有效地识别马甲账号。

    一种基于依存句法关系的微博马甲账号识别方法

    公开(公告)号:CN106021232A

    公开(公告)日:2016-10-12

    申请号:CN201610350203.2

    申请日:2016-05-24

    CPC classification number: G06F17/271 H04L51/046 H04L63/08

    Abstract: 本发明涉及一种基于依存句法关系的微博马甲账号识别方法,具体步骤如下:步骤一:获取微博文本数据;步骤二:采用分词软件进行分词,去除英文及标点符号;步骤三:采用依存句法分析软件,对已分词后的文本进行依存句法分析,每条微博会得到一个句法分析结果;步骤四:某人的微博列表中的每个文本利用步骤三的方法得到分析结果;采用Apriori算法计算某人微博的常用依存句法结构;步骤五:将需要判断是否为马甲关系的两个账号分别按照步骤一至四的结果进行对比,相同即为马甲关系,反之,则为非马甲关系。本发明方法可以用在社交网站对于网络安全的管理以及政府关于网络犯罪的追查,能够快速,有效地识别马甲账号。

    一种基于三角结构的社会网络节点影响力度量方法

    公开(公告)号:CN105719190A

    公开(公告)日:2016-06-29

    申请号:CN201610031130.0

    申请日:2016-01-18

    CPC classification number: G06Q50/01 G06F17/30864

    Abstract: 本发明一种基于三角结构的社会网络节点影响力度量方法,将用户和用户间的关系抽象为网络拓扑结构中的节点和连边形成社会网络拓扑图。以图为对象,结合当前节点与其邻居之间三角结构的数量和邻居节点的度值,度量当前节点与邻居节点之间的连边对当前节点影响力的贡献。然后计算当前节点的所有连接对节点影响力贡献之和,从而得到节点的最终影响力并通过排序可以得到影响力最大的节点子集。社会网络中,三个节点之间两两连接形成三角结构,若两个节点之间形成三角结构的数量越多,则两个节点的联系越紧密,这两个节点处于联系紧密的小团体内部中的可能性较大,对于节点的全局影响力是起负面作用的。

Patent Agency Ranking