基于逐点互信息技术的诈骗信息特征词提取方法及系统

    公开(公告)号:CN107992473B

    公开(公告)日:2021-04-27

    申请号:CN201711190871.4

    申请日:2017-11-24

    Abstract: 本发明涉及一种基于逐点互信息技术的诈骗信息特征词提取方法及系统,该提取方法包括:提取诈骗信息主题关键词,组成主题关键词集合;将信息组中的信息按是否为诈骗信息划分为正样本集合和负样本集合,并得到正样本分词集合、负样本候分词集合和候选关键词集合;根据候选关键词集合的候选关键词在信息组的正相互性PMI值和负相互性PMI值得到候选关键词在信息组的权重,将权重大于预设阈值的候选关键词记为信息组的合格关键词。本发明通过对信息组中的信息进行处理,得到候选关键词集合,计算候选关键词相对于信息的正相互性PMI值和负相互性PMI值,得到候选关键词的权重,由此判断是否为合格关键词,实现了对数据流式信息的关键词提取。

    一种事件演化知识图谱构建方法、装置、设备及存储介质

    公开(公告)号:CN111506734A

    公开(公告)日:2020-08-07

    申请号:CN201910092807.5

    申请日:2019-01-30

    Abstract: 本申请涉及一种事件演化知识图谱构建方法、装置、设备及存储介质,该方法包括:获取新闻的中文新闻报道;从中文新闻报道中提取对应的事件要素,组合成与中文新闻报道对应的中文事件,事件要素包括:事件触发词和事件论元;基于事件要素中的事件论元,针对每个不同新闻,将各自对应的多个不同中文事件进行关联;根据事件触发词的先验事理关系,构建相关联的多个不同中文事件之间的事件演化知识图谱。该方法可以缓解现有技术中存在的演化事件的准确度不高的问题,达到了提高演化事件的准确度的技术效果。

    基于图神经网络的谣言立场检测方法、装置和电子设备

    公开(公告)号:CN111159395A

    公开(公告)日:2020-05-15

    申请号:CN201911158422.0

    申请日:2019-11-22

    Abstract: 本申请涉及一种基于图神经网络的谣言立场检测方法、装置和电子设备,所述方法包括:获取谣言数据;根据所述谣言数据的特征构建异构图,其中,所述异构图包括多个节点,所述节点用于表示所述谣言数据;将所述异构图输入图神经网络模型,得到对所述节点的立场分类结果,其中,所述立场分类结果是由所述图神经网络模型确定所述节点的目标特征,并根据每个所述节点的目标特征经过分类得到的。本申请通过构建异构图,使用图神经网络进行图表征学习,无需依赖较大的数据规模,快速高效捕获目标帖子的邻居分布特征及跨主题特征,实现对帖子的立场进行分类。

    一种基于企业关联关系的工商高管人名消歧方法

    公开(公告)号:CN110020433A

    公开(公告)日:2019-07-16

    申请号:CN201910256769.2

    申请日:2019-04-01

    Abstract: 本发明公开了一种基于企业关联关系的工商高管人名消歧方法,涉及实体消歧领域,包括以下步骤:将待消歧数据集U,按高管姓名划分成组n个高管姓名组A;根据步骤S1得到的姓名组划分结果,对每个组A,构建N层以内的高管及企业关联关系网络G;针对每个姓名组A,根据密切度计算规则,计算姓名组A中高管节点之间的关联密切度f;根据关联密切度构建聚类函数CL,使用层次聚类算法得到消歧结果。本发明能自动化对工商高管人名进行消歧,具有较高的消歧准确率,且具有一定的阈值设置灵活性,可满足较多应用场景的工商高管人名消歧;同时可构建高管任职关联关系、高管投资关联关系,为高管全视角的关联图谱分析提供支撑。

    互联网金融平台信用风险监测雷达软件系统

    公开(公告)号:CN109447815A

    公开(公告)日:2019-03-08

    申请号:CN201811281377.3

    申请日:2018-10-31

    Abstract: 本发明涉及金融风险监测领域,具体的说是一种互联网金融平台信用风险监测雷达软件系统;包括股东变更次数指标模块、法人变更次数指标模块、高管变更次数指标模块、法人涉及民事诉讼次数指标模块以及经营者经营过其他问题平台指标模块,雷达图以正五边形的角展示上述各指标模块的指标,并依次连接正五边形的角与五边形中心,并在该线段上标注刻度,将各指数模块的指标得分分别标注在各自线段上,然后连接五大指标模块分数点,在正五边形内部形成另一五边形;采用本发明技术方案的软件系统,可以通过被标记的五边形的面积直观比较各个平台风险大小。

    基于逐点互信息技术的诈骗信息特征词提取方法及系统

    公开(公告)号:CN107992473A

    公开(公告)日:2018-05-04

    申请号:CN201711190871.4

    申请日:2017-11-24

    Abstract: 本发明涉及一种基于逐点互信息技术的诈骗信息特征词提取方法及系统,该提取方法包括:提取诈骗信息主题关键词,组成主题关键词集合;将信息组中的信息按是否为诈骗信息划分为正样本集合和负样本集合,并得到正样本分词集合、负样本候分词集合和候选关键词集合;根据候选关键词集合的候选关键词在信息组的正相互性PMI值和负相互性PMI值得到候选关键词在信息组的权重,将权重大于预设阈值的候选关键词记为信息组的合格关键词。本发明通过对信息组中的信息进行处理,得到候选关键词集合,计算候选关键词相对于信息的正相互性PMI值和负相互性PMI值,得到候选关键词的权重,由此判断是否为合格关键词,实现了对数据流式信息的关键词提取。

    一种微博舆情指标体系的计算方法及装置

    公开(公告)号:CN106294334A

    公开(公告)日:2017-01-04

    申请号:CN201510236658.7

    申请日:2015-05-11

    Abstract: 本发明公开了一种微博舆情指标体系的计算方法及装置。其中,该方法包括:构建微博舆情指标体系;其中,微博舆情指标体系包括:微博主体、微博信息、微博话题和微博舆情;计算微博主体的活跃度和影响力;计算微博信息的热度和影响力;计算微博话题的热度和影响力;基于计算结果得到微博舆情综合指数。本发明构建了微博舆情指标体系,并且基于微博舆情指标体系,可准确获取得到微博舆情综合指数。解决了相关技术中舆情分析指标体系过于庞大,针对性不强的问题。微博作为网络舆情的主要推动媒介,基于本发明研究的微博舆情指标体系,将能更加准确的评估社会舆情安全状态。

Patent Agency Ranking