一种流式数据主题挖掘方法及其系统

    公开(公告)号:CN107992474B

    公开(公告)日:2021-04-27

    申请号:CN201711193285.5

    申请日:2017-11-24

    Abstract: 本发明涉及一种流式数据主题挖掘方法及其系统,该挖掘方法包括:对结构化数据进行筛选,得到主题数据,提取主题数据的主题实体和主题关键词,分别生成主题实体集合和主题关键词集合;提取候选新闻数据的新闻实体和新闻关键词,分别生成新闻实体集合和新闻关键词集合;分别计算得到实体相关度、关键词相关度和核心词相关度;计算候选新闻数据与主题数据的新闻主题相似度,并将新闻主题相似度大于预设阈值的候选新闻数据导入合格新闻数据集合。本发明能够从海量的实时流式数据中准确找到用户关注的特定主题的相关新闻,保证了该主题下新闻的实时性、准确性,以及该主题下新闻动态的变化过程,并对新闻内容进行了分析。

    基于逐点互信息技术的诈骗信息特征词提取方法及系统

    公开(公告)号:CN107992473B

    公开(公告)日:2021-04-27

    申请号:CN201711190871.4

    申请日:2017-11-24

    Abstract: 本发明涉及一种基于逐点互信息技术的诈骗信息特征词提取方法及系统,该提取方法包括:提取诈骗信息主题关键词,组成主题关键词集合;将信息组中的信息按是否为诈骗信息划分为正样本集合和负样本集合,并得到正样本分词集合、负样本候分词集合和候选关键词集合;根据候选关键词集合的候选关键词在信息组的正相互性PMI值和负相互性PMI值得到候选关键词在信息组的权重,将权重大于预设阈值的候选关键词记为信息组的合格关键词。本发明通过对信息组中的信息进行处理,得到候选关键词集合,计算候选关键词相对于信息的正相互性PMI值和负相互性PMI值,得到候选关键词的权重,由此判断是否为合格关键词,实现了对数据流式信息的关键词提取。

    一种事件演化知识图谱构建方法、装置、设备及存储介质

    公开(公告)号:CN111506734A

    公开(公告)日:2020-08-07

    申请号:CN201910092807.5

    申请日:2019-01-30

    Abstract: 本申请涉及一种事件演化知识图谱构建方法、装置、设备及存储介质,该方法包括:获取新闻的中文新闻报道;从中文新闻报道中提取对应的事件要素,组合成与中文新闻报道对应的中文事件,事件要素包括:事件触发词和事件论元;基于事件要素中的事件论元,针对每个不同新闻,将各自对应的多个不同中文事件进行关联;根据事件触发词的先验事理关系,构建相关联的多个不同中文事件之间的事件演化知识图谱。该方法可以缓解现有技术中存在的演化事件的准确度不高的问题,达到了提高演化事件的准确度的技术效果。

    基于图神经网络的谣言立场检测方法、装置和电子设备

    公开(公告)号:CN111159395A

    公开(公告)日:2020-05-15

    申请号:CN201911158422.0

    申请日:2019-11-22

    Abstract: 本申请涉及一种基于图神经网络的谣言立场检测方法、装置和电子设备,所述方法包括:获取谣言数据;根据所述谣言数据的特征构建异构图,其中,所述异构图包括多个节点,所述节点用于表示所述谣言数据;将所述异构图输入图神经网络模型,得到对所述节点的立场分类结果,其中,所述立场分类结果是由所述图神经网络模型确定所述节点的目标特征,并根据每个所述节点的目标特征经过分类得到的。本申请通过构建异构图,使用图神经网络进行图表征学习,无需依赖较大的数据规模,快速高效捕获目标帖子的邻居分布特征及跨主题特征,实现对帖子的立场进行分类。

    基于逐点互信息技术的诈骗信息特征词提取方法及系统

    公开(公告)号:CN107992473A

    公开(公告)日:2018-05-04

    申请号:CN201711190871.4

    申请日:2017-11-24

    Abstract: 本发明涉及一种基于逐点互信息技术的诈骗信息特征词提取方法及系统,该提取方法包括:提取诈骗信息主题关键词,组成主题关键词集合;将信息组中的信息按是否为诈骗信息划分为正样本集合和负样本集合,并得到正样本分词集合、负样本候分词集合和候选关键词集合;根据候选关键词集合的候选关键词在信息组的正相互性PMI值和负相互性PMI值得到候选关键词在信息组的权重,将权重大于预设阈值的候选关键词记为信息组的合格关键词。本发明通过对信息组中的信息进行处理,得到候选关键词集合,计算候选关键词相对于信息的正相互性PMI值和负相互性PMI值,得到候选关键词的权重,由此判断是否为合格关键词,实现了对数据流式信息的关键词提取。

    一种微博舆情指标体系的计算方法及装置

    公开(公告)号:CN106294334A

    公开(公告)日:2017-01-04

    申请号:CN201510236658.7

    申请日:2015-05-11

    Abstract: 本发明公开了一种微博舆情指标体系的计算方法及装置。其中,该方法包括:构建微博舆情指标体系;其中,微博舆情指标体系包括:微博主体、微博信息、微博话题和微博舆情;计算微博主体的活跃度和影响力;计算微博信息的热度和影响力;计算微博话题的热度和影响力;基于计算结果得到微博舆情综合指数。本发明构建了微博舆情指标体系,并且基于微博舆情指标体系,可准确获取得到微博舆情综合指数。解决了相关技术中舆情分析指标体系过于庞大,针对性不强的问题。微博作为网络舆情的主要推动媒介,基于本发明研究的微博舆情指标体系,将能更加准确的评估社会舆情安全状态。

    一种基于云服务的软件稳定性测试远程监控系统

    公开(公告)号:CN104967667A

    公开(公告)日:2015-10-07

    申请号:CN201510278645.6

    申请日:2015-05-27

    CPC classification number: H04L67/025 H04L43/08 H04L67/10

    Abstract: 本发明公开了一种基于云服务的软件稳定性测试远程监控系统,包括:在每个loadrunner控制主机上部署一个loadrunner代理采集模块,用于采集对应loadrunner控制主机上的测试信息,并将采集的测试信息发送至局域网服务器数据库;数据处理模块,用于将局域网服务器数据库中存储的测试信息进行格式转换及压缩处理后发送至云服务器;云服务器,用于将接收到的测试信息进行解压处理,并按信息类型插入到云服务器数据库中;云服务器Web展现模块,用于提供人机交互界面,通过与所述云服务器数据库通信,响应用户的查询操作。本发明很好的解决了使用Loadrunner软件进行长时间稳定性测试远程监控困难的问题。

    一种消息混合匿名通信方法及装置

    公开(公告)号:CN101605107B

    公开(公告)日:2011-09-21

    申请号:CN200910089500.6

    申请日:2009-07-22

    Abstract: 本发明公开了一种能够适应消息流量环境变化并能满足用户个性化匿名需求的消息混合匿名通信方法及装置,该装置在传统的消息混合匿名通信装置中引入了流量环境感知器和用户匿名期望值提取模块,其中流量环境感知器用于获取消息流量环境特征值dt,然后根据该消息流量环境特征值可以计算消息输出概率p(mi),当消息刷新时机到来时,以概率p(mi)输出消息mi,以概率1-p(mi)保留消息不输出;其中,消息流量环境特征值dt=β·nt+(1-β)·dt-1,nt为当前单位时间内到达的输入消息个数,β为平滑常数,dt-1为上一单位时间的流量特征值;消息输出概率用户匿名期望值提取模块用于在消息中提取用户设置的匿名期望值参数α,该参数表示消息输出概率随消息流量环境特征值变化而变化的幅度。

Patent Agency Ranking