基于波特五力模型的企业情报收集方法

    公开(公告)号:CN104063411B

    公开(公告)日:2016-05-25

    申请号:CN201310414542.9

    申请日:2013-09-12

    IPC分类号: G06F17/30 G06Q10/06

    摘要: 本发明公开了一种基于波特五力模型的企业情报收集方法,首先将波特五力模型中的潜在竞争者、竞争者、供应商、购买者、替代品的影响因素量化,根据量化因素构建的采集规则,采集信息集合I;其次结构化抽取集合I中的五力影响因素及企业本身的结构化信息集合S;再次分析结构化信息集合S,智能分析企业竞争情报,自动发现企业同类产品及竞争对手,分析热点事件的发展趋势;最终将竞争情报推送给用户。本发明方法实现了企业竞争情报的收集及整合分析。

    一种文本内的基于语义特征的人称代词指代消解方法

    公开(公告)号:CN104462053A

    公开(公告)日:2015-03-25

    申请号:CN201310431571.6

    申请日:2013-09-22

    IPC分类号: G06F17/27

    摘要: 本发明公开了一种文本内的基于语义特征的人称代词指代消解方法,具体步骤如下:(1)人物识别。对文本进行预处理,所述预处理包括:段落、语句识别、命名实体识别、词性标注;对处理后的文本,确定人物及代词在文本内中的位置。(2)语义特征提取。对识别出的人物及代词根据其各自所在语句及段落信息,提取语义关联词,构建人名及代词语义特征。(3)候选人物选择。针对人物及代词的性别、单复数、距离进行过滤,为代词选择若干符合条件的候选人物。(3)指代关系计算。计算代词与候选人物的语义特征相关度,结合语义特征相关度及两者间的距离,确定代词的指代人物。本发明方法实现了文本内的人称代词指代消解。

    一种文本内的基于语义特征的人称代词指代消解方法

    公开(公告)号:CN104462053B

    公开(公告)日:2018-10-12

    申请号:CN201310431571.6

    申请日:2013-09-22

    IPC分类号: G06F17/27

    摘要: 本发明公开了一种文本内的基于语义特征的人称代词指代消解方法,具体步骤如下:(1)人物识别。对文本进行预处理,所述预处理包括:段落、语句识别、命名实体识别、词性标注;对处理后的文本,确定人物及代词在文本内中的位置。(2)语义特征提取。对识别出的人物及代词根据其各自所在语句及段落信息,提取语义关联词,构建人名及代词语义特征。(3)候选人物选择。针对人物及代词的性别、单复数、距离进行过滤,为代词选择若干符合条件的候选人物。(3)指代关系计算。计算代词与候选人物的语义特征相关度,结合语义特征相关度及两者间的距离,确定代词的指代人物。本发明方法实现了文本内的人称代词指代消解。

    一种基于规则的信息相关性判定方法

    公开(公告)号:CN105930468A

    公开(公告)日:2016-09-07

    申请号:CN201610258136.1

    申请日:2016-04-22

    IPC分类号: G06F17/30

    CPC分类号: G06F17/30867

    摘要: 本发明公开了一种基于规则的信息相关性判定方法,首先判断规则与信息的标题的相关性。当规则与标题相关,规则与信息相关,判断结束;否则继续判断规则与信息正文的相关性。根据规则的核心词、规则类型及正文类型,划分正文句子,获取最短距离句子集,判断规则与最短距离句子集的相关性,得到规则与正文的相关性。再根据规则与正文的相关性,获得规则与信息的相关性。本发明通过判定信息的类型,规则中的关键词,规则的类型,并基于条件的最短距离句子,进行相关性判定,得到判定结果。通过对规则及信息的分析,可以提高规则在信息中的匹配准确度,提高了信息相关性判定能力,具有很强的实用性。

    基于波特五力模型的企业情报收集方法

    公开(公告)号:CN104063411A

    公开(公告)日:2014-09-24

    申请号:CN201310414542.9

    申请日:2013-09-12

    IPC分类号: G06F17/30 G06Q10/06

    摘要: 本发明公开了一种基于波特五力模型的企业情报收集方法,首先将波特五力模型中的潜在竞争者、竞争者、供应商、购买者、替代品的影响因素量化,根据量化因素构建的采集规则,采集信息集合I;其次结构化抽取集合I中的五力影响因素及企业本身的结构化信息集合S;再次分析结构化信息集合S,智能分析企业竞争情报,自动发现企业同类产品及竞争对手,分析热点事件的发展趋势;最终将竞争情报推送给用户。本发明方法实现了企业竞争情报的收集及整合分析。

    一种基于规则的信息相关性判定方法

    公开(公告)号:CN105930468B

    公开(公告)日:2019-05-17

    申请号:CN201610258136.1

    申请日:2016-04-22

    IPC分类号: G06F16/9535

    摘要: 本发明公开了一种基于规则的信息相关性判定方法,首先判断规则与信息的标题的相关性。当规则与标题相关,规则与信息相关,判断结束;否则继续判断规则与信息正文的相关性。根据规则的核心词、规则类型及正文类型,划分正文句子,获取最短距离句子集,判断规则与最短距离句子集的相关性,得到规则与正文的相关性。再根据规则与正文的相关性,获得规则与信息的相关性。本发明通过判定信息的类型,规则中的关键词,规则的类型,并基于条件的最短距离句子,进行相关性判定,得到判定结果。通过对规则及信息的分析,可以提高规则在信息中的匹配准确度,提高了信息相关性判定能力,具有很强的实用性。

    一种互联网人物信息的属性提取方法

    公开(公告)号:CN104462075A

    公开(公告)日:2015-03-25

    申请号:CN201310414531.0

    申请日:2013-09-12

    IPC分类号: G06F17/30

    CPC分类号: G06F17/30864

    摘要: 本发明公开了一种互联网人物属性的提取方法,其首先利用搜索引擎根据制定好的由一些特定关键字组成的规则搜索采集来的信息集合S;对信息集合S中的文章中出现的人物的属性进行提取,如单位、电话、邮箱等信息;根据属性的不同采用了不同的提取策略,如果对于电话、邮箱采用了正则表达式进行匹配提取,而对于单位等属性采用了关键词结合词性的方法进行提取。并对自定义属性进行了初步的提取。本发明方法实现了对人物属性信息的自动提取。

    一种适用于互联网分析的本体构建方法

    公开(公告)号:CN104063412A

    公开(公告)日:2014-09-24

    申请号:CN201310430787.0

    申请日:2013-09-22

    IPC分类号: G06F17/30

    CPC分类号: G06F17/30864 G06F17/3089

    摘要: 本发明公开了一种适用于互联网分析的本体构建方法,本体分为行业本体、通用本体两个部分。其中通用本体又包括公职人员负面本体、机构组织负面本体、职位库、地域库。对于行业本体构建采用手工结合自动的构建方法。首先手工分类好公安、消防等行业,定义关键词进行采集信息得到信息集合S,并对信息集合S进行关键词提取并进行手工筛选。对于公职人员、组织机构负面本体本体构建方法与行业本体基本相同,增加了对于关键词的同义词、关联词关系的添加。本发明有效的提高了互联网信息检索、扩展。