-
公开(公告)号:CN114861661A
公开(公告)日:2022-08-05
申请号:CN202110077227.6
申请日:2021-01-20
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/295 , G06N3/04 , G06N3/08 , G06Q40/00
Abstract: 本申请涉及一种实体识别方法、装置、设备及存储介质。该方法包括获取非法集资线索数据;确定与非法集资线索数据对应的字向量序列;利用预先训练得到的BiLSTM‑CRF模型对字向量序列进行推理,得到与非法集资线索数据对应的标签序列;从标签序列中提取属于实体标签的目标标签,并将目标标签对应的数据作为非法集资线索数据中的非法集资线索实体。可见,采用本申请的技术方案实现了对非法集资线索实体的自动识别,不仅识别效率高,且可以做到实时识别。
-
公开(公告)号:CN111160005B
公开(公告)日:2022-06-24
申请号:CN201911168831.9
申请日:2019-11-25
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/211 , G06F40/289 , G06F40/30 , G06F16/36 , G06N3/04 , G06N3/08
Abstract: 本申请涉及一种基于事件演化知识本体的事件预测方法、装置及终端设备。其中,该方法包括:通过构建具备事件演化关系的事件演化本体知识库,从事件演化本体知识库中抽取出第一事件链和第一事件元组,采用远程监督的方式,利用第一事件元组和第一事件链对非结构化文本进行关系数据回标,得到具有事件演化关系的事件数据,利用事件数据训练以建立事件预测模型的方法,可以基于知识有效的快速获得大量已标注的训练数据,从而有效提升事件预测的准确度。
-
公开(公告)号:CN113076422B
公开(公告)日:2022-06-03
申请号:CN202110406469.5
申请日:2021-04-15
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及社交事件检测技术领域,且公开了一种基于联邦图神经网络的多语种社交事件检测方法,包括以下步骤:S1:提取消息,将社交信息中的消息提取出来,然后将和消息有关的消息也提取出来当作异构图中的节点;S2:添加节点边,根据社交信息添加节点之间的边;S3:预训练阶段,使用图神经网络学习消息的表征,对消息图进行初始化并且初始化模型。本发明将社会信息中丰富的语义和结构信息融合在一起,以获取更多的知识,能够应对持续的社交检测事件,并使用动态社交流扩展其知识,可以实现不同语言模态数据环境下高准确性的事件检测,有效缓解了少样本的小语种事件检测难题。
-
公开(公告)号:CN113722481A
公开(公告)日:2021-11-30
申请号:CN202110971648.3
申请日:2021-08-23
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F40/216 , G06F40/289 , G06N3/04
Abstract: 本申请涉及一种基于类别和实例增强的文本多事件检测方法与装置,其中,方法包括:获取待检测文本的文本表示数据。根据类别标签表示和文本表示数据,确定出待检测文本的每个字符的各第一中间结果,第一中间结果表示出其对应的字符是事件之一对应的触发词的概率。根据对各第一中间结果处理得到的综合文本特征和文本表示数据,得到待检测文本中的每个字符相对于每个事件的检测结果。在待检测本文对应于若干个事件的情况下,基于事件和触发词之间的对应关系,能够对一待检测文本中的表示出的多个事件进行检测,以基于事件之间的相关性,提升事件检测的准确率。
-
公开(公告)号:CN113378090A
公开(公告)日:2021-09-10
申请号:CN202110445408.X
申请日:2021-04-23
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/958 , G06F16/35 , G06F40/284 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种互联网网站相似度分析方法、装置以及可读存储介质,方法包括:从多个未分类的互联网网站中提取文本特征词;将各个未分类的互联网网站的文本特征词分别输入预先获取到的孪生网络编码工具,得到各个未分类的互联网网站的文本向量序列,其中:所述孪生网络编码工具是从训练好的孪生网络中的输入层至权值共享循环神经网络层进行迁移得到,且所述孪生网络的训练是基于从多个已分类的互联网网站中提取的文本特征词实现;将各个未分类的互联网网站的文本向量序列组成的矩阵进行降维处理得到低维弱相关矩阵;对低维弱相关矩阵进行聚类分析,根据聚类分析结果获取所述多个未分类的互联网网站的相似度情况,从而实现互联网网站相似度分析。
-
公开(公告)号:CN113076422A
公开(公告)日:2021-07-06
申请号:CN202110406469.5
申请日:2021-04-15
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及社交事件检测技术领域,且公开了一种基于联邦图神经网络的多语种社交事件检测方法,包括以下步骤:S1:提取消息,将社交信息中的消息提取出来,然后将和消息有关的消息也提取出来当作异构图中的节点;S2:添加节点边,根据社交信息添加节点之间的边;S3:预训练阶段,使用图神经网络学习消息的表征,对消息图进行初始化并且初始化模型。本发明将社会信息中丰富的语义和结构信息融合在一起,以获取更多的知识,能够应对持续的社交检测事件,并使用动态社交流扩展其知识,可以实现不同语言模态数据环境下高准确性的事件检测,有效缓解了少样本的小语种事件检测难题。
-
公开(公告)号:CN107992474B
公开(公告)日:2021-04-27
申请号:CN201711193285.5
申请日:2017-11-24
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/295 , G06F40/284 , G06F16/2458 , G06F16/215
Abstract: 本发明涉及一种流式数据主题挖掘方法及其系统,该挖掘方法包括:对结构化数据进行筛选,得到主题数据,提取主题数据的主题实体和主题关键词,分别生成主题实体集合和主题关键词集合;提取候选新闻数据的新闻实体和新闻关键词,分别生成新闻实体集合和新闻关键词集合;分别计算得到实体相关度、关键词相关度和核心词相关度;计算候选新闻数据与主题数据的新闻主题相似度,并将新闻主题相似度大于预设阈值的候选新闻数据导入合格新闻数据集合。本发明能够从海量的实时流式数据中准确找到用户关注的特定主题的相关新闻,保证了该主题下新闻的实时性、准确性,以及该主题下新闻动态的变化过程,并对新闻内容进行了分析。
-
公开(公告)号:CN107992473B
公开(公告)日:2021-04-27
申请号:CN201711190871.4
申请日:2017-11-24
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/289 , G06F16/35
Abstract: 本发明涉及一种基于逐点互信息技术的诈骗信息特征词提取方法及系统,该提取方法包括:提取诈骗信息主题关键词,组成主题关键词集合;将信息组中的信息按是否为诈骗信息划分为正样本集合和负样本集合,并得到正样本分词集合、负样本候分词集合和候选关键词集合;根据候选关键词集合的候选关键词在信息组的正相互性PMI值和负相互性PMI值得到候选关键词在信息组的权重,将权重大于预设阈值的候选关键词记为信息组的合格关键词。本发明通过对信息组中的信息进行处理,得到候选关键词集合,计算候选关键词相对于信息的正相互性PMI值和负相互性PMI值,得到候选关键词的权重,由此判断是否为合格关键词,实现了对数据流式信息的关键词提取。
-
公开(公告)号:CN111506734A
公开(公告)日:2020-08-07
申请号:CN201910092807.5
申请日:2019-01-30
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/36 , G06N5/04 , G06F40/247 , G06Q50/26
Abstract: 本申请涉及一种事件演化知识图谱构建方法、装置、设备及存储介质,该方法包括:获取新闻的中文新闻报道;从中文新闻报道中提取对应的事件要素,组合成与中文新闻报道对应的中文事件,事件要素包括:事件触发词和事件论元;基于事件要素中的事件论元,针对每个不同新闻,将各自对应的多个不同中文事件进行关联;根据事件触发词的先验事理关系,构建相关联的多个不同中文事件之间的事件演化知识图谱。该方法可以缓解现有技术中存在的演化事件的准确度不高的问题,达到了提高演化事件的准确度的技术效果。
-
公开(公告)号:CN111402054A
公开(公告)日:2020-07-10
申请号:CN202010184049.2
申请日:2020-03-16
Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
Inventor: 蒋燕萍 , 吴震 , 贺敏 , 王飞 , 张林波 , 吴莉莉 , 杨菁林 , 邢凯 , 王锟 , 徐小磊 , 董皓 , 王凡凡 , 郭艳军 , 王倩倩 , 杜漫 , 刘昕明 , 余智华
IPC: G06Q40/04
Abstract: 本发明涉及金融平台风险分析领域,具体涉及一种股权融资平台风险判定方法及系统,包括设制判定股权融资平台的风险指标体系,风险项和与风险项对应的风险判断标准;对需要进行风险判定的股权融资平台进行分析,得出与风险项相应的第一指标,判定第一指标是否命中所述风险判断标准,并根据所述判定对第一指标设置风险标记;设定风险模型公式,根据风险模型公式对风险标记行计算,得出标记结果;根据风险指标体系制定风险等级模型,将标记结果与所述风险等级模型进行对比,输出实际风险等级;所述风险项风险判断标准、风险标记构成的风险指标体系很好的解决了现有股权融资平台风险判定不可靠、不完备的问题,达到了全面、有针对性的技术效果。
-
-
-
-
-
-
-
-
-