-
公开(公告)号:CN109472691A
公开(公告)日:2019-03-15
申请号:CN201811281448.X
申请日:2018-10-31
Applicant: 哈尔滨工业大学 , 国家计算机网络与信息安全管理中心
IPC: G06Q40/02
Abstract: 本发明涉及金融风险监测领域,具体的说是一种互联网金融企业异常预警排名方法及软件系统;包括有以下步骤,首先确定异常类型;确定每个异常类型下的异常指标;根据各异常类型下触发异常预警阈值的指标个数,确定该异常类型下各互联网金融企业的单项异常预警排名根据异常类型的个数对所有企业进行综合排序;采用本发明技术方案的异常预警排名方法,既能、从单个异常类型角度对所有互联网金融企业进行单项排名,也能从综合所有异常类型对所有互联网金融企业进行综合排名,便于使用者根据企业异常预警排名或是自己重点关注的异常类型的排名进行选择与决策。
-
公开(公告)号:CN107944559A
公开(公告)日:2018-04-20
申请号:CN201711190865.9
申请日:2017-11-24
Applicant: 国家计算机网络与信息安全管理中心
CPC classification number: G06N5/022 , G06N3/0454
Abstract: 本发明涉及一种实体关系自动识别方法及系统,该方法包括:训练卷积神经网络得到实体关系识别模型;获取对应待确认实体组的相关语料库;将相关语料进行分词,并将分词得到的相关词语转化为相关词向量;将相关词向量按相关语料转化为矩阵作为实体关系识别模型的输入,得到相关关系种类和相关关系种类的相似度值,将相似度值高的相关关系种类作为待确认实体组的关系种类。本发明通过锻炼卷积神经网络作为实体关系识别模型,在出现新增实体时,计算得到一系列新增实体组的关系种类,并得出每一项关系种类的相似度值,通过具体的数值来确定相关关系种类的程度,提高得到的新增实体组之间关系种类的准确性。
-
公开(公告)号:CN106294335A
公开(公告)日:2017-01-04
申请号:CN201510236792.7
申请日:2015-05-11
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
Abstract: 本发明要解决的技术问题是提供一种用于微博的热点话题检测方法及装置,涉及网络信息挖掘技术领域,能够解决特征高度稀疏的微博文本热点话题检测困难的问题。所述方法包括:提取信息流中的有意义串并对所述有意义串进行热度分析,以从中筛选出热点特征;根据信息瓶颈理论对所述热点特征进行特征合并,并且计算合并后的合并程度指示参数;根据所述合并程度指示参数确定热点话题。
-
公开(公告)号:CN106294333A
公开(公告)日:2017-01-04
申请号:CN201510236634.1
申请日:2015-05-11
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
Abstract: 本发明提供一种微博突发话题检测方法及装置,用以解决目前微博突发话题难以识别的问题,该方法包括,提取指定的微博数据集合中的特征项,特征项为包含具体语义的语言单元;确定特征项在微博数据集合的文本中的流通度以及特征项当前的热度;以流通度为质量参数项,以热度为位置参数项对特征项进行动力学建模,得到特征项的当前能量和加速度;在得到的能量以及加速度分别大于第一预设值以及第二预设值时,检测突发特征项;根据检测到的突发特征项在同一条微博中同时出现的情况计算突发特征项之间的互信息;当互信息大于第三阈值时,对突发特征项进行合并,得到突发话题,该方案能够提高微博突发话题检测的准确率。
-
公开(公告)号:CN106294332A
公开(公告)日:2017-01-04
申请号:CN201510236598.9
申请日:2015-05-11
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明提供一种微博话题特征提取方法及装置,用以解决目前采用静态词典中的词语特征来表示微博文本,会遗漏大量的关键特征,不能准确反映实时微博信息的问题。该方法包括:提取微博中的有意义字符串,有意义字符串为包含具有语义、能够独立使用的语言单元;提取有意义字符串的异质属性信息;根据异质属性信息对有意义字符串进行分类,得到微博话题相关的特征项,采用该方案能提高微博信息中的特征项提取的准确性。
-
公开(公告)号:CN105824801A
公开(公告)日:2016-08-03
申请号:CN201610150794.9
申请日:2016-03-16
Applicant: 国家计算机网络与信息安全管理中心
CPC classification number: G06F17/2785 , G06F16/288
Abstract: 本发明提供一种基于自动机的实体关系快速抽取方法,包括以下步骤:步骤1,定制规则文件;步骤2,对规则文件中的各个规则进行文法检查,检测规则文件中的各个规则是否满足文法要求,如果满足,则执行步骤3;步骤3,对通过文法检查的所述规则文件中的各个规则进行语义解释;步骤4,将语义解释后的所述规则文件中的各个规则进行解析编译,完成规则向层叠有限状态自动机的转换,得到有限状态自动机;步骤5,使用所述有限状态自动机,对输入的文本数据进行实体属性以及实体关系的抽取,得到最终的实体属性以及实体关系。优点为:能够保证对开放域文本进行快速的实体关系与实体属性抽取。同时,对于特定领域的实体关系可以定制化的进行抽取。
-
公开(公告)号:CN103823751A
公开(公告)日:2014-05-28
申请号:CN201310682073.9
申请日:2013-12-13
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F11/36
Abstract: 本发明是关于一种基于特征注入的仿冒应用程序监测方法,包括以下步骤:步骤S1,获取待监测的应用程序;步骤S2,根据上述应用程序的文件结构,在待监测的应用程序中注入监测特征;步骤S3,对含有监测特征的应用程序进行数字签名;步骤S4,记录待监测应用程序被注入的监测特征与数字签名的配对信息;步骤S5,对被注入监测特征的应用程序进行监测;其中,在监测过程中,当捕获到的应用程序文件中含有被注入的监测特征时,如果该应用程序的数字签名与监测特征对应的签名不一致时,表明该捕获到的应用程序是仿冒应用程序;反之,表明不是仿冒应用程序。借由本发明,能够快速准确地识别仿冒应用程序,实现对仿冒应用程序的实时监测。
-
公开(公告)号:CN119940360A
公开(公告)日:2025-05-06
申请号:CN202510203852.9
申请日:2025-02-24
Applicant: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司
IPC: G06F40/284 , G06F40/216 , G06F40/166 , G06F16/35 , G06N3/045 , G06N3/08
Abstract: 本发明提供了一种基于大语言模型的企业文本数据多维处理方法和电子设备,包括:获取待处理文本数据中的关键词和对应的权重,并将获取的关键词按照权重由大到小的顺序进行重排序,得到排序后的关键词;为排序后的关键词赋予新权重,作为该关键词的最终权重;基于每个关键词对应的最终权重,从待处理文本数据中获取对应的上下文内容,作为对应的文本片段;利用多个文本分类模型对每个文本片段的类别标签进行预测,类别标签包括表征文本数据为正常文本数据的第一标签和表征文本数据为异常文本数据的第二标签。本发明基于关键词抽取和重排序进行数据处理,融合多种方式进行多维度分类,能够提高异常文本数据识别的准确率和增强泛化能力和鲁棒性。
-
公开(公告)号:CN114819432B
公开(公告)日:2025-04-11
申请号:CN202110065882.X
申请日:2021-01-18
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06Q10/0635
Abstract: 本发明实施例涉及一种企业非法集资风险预测方法、装置、电子设备及存储介质,所述方法包括:获取待进行非法集资风险预测的目标企业的企业数据;对所述企业数据进行特征提取,得到所述目标企业的企业特征;将所述企业特征输入至至少一个已训练的非法集资风险预测模型,得到至少一个所述目标企业非法集资的风险概率;根据至少一个所述目标企业非法集资的风险概率确定所述目标企业是否存在非法集资风险。由此,可以提高对企业非法集资风险进行预测的预测结果的准确性。
-
公开(公告)号:CN114817485B
公开(公告)日:2024-09-06
申请号:CN202110078586.3
申请日:2021-01-20
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/332 , G06F16/35 , G06F18/241
Abstract: 本发明实施例涉及一种非法集资线索识别方法、装置、电子设备及存储介质,所述方法包括:获取多个待进行非法集资线索识别的目标文本数据;基于预设的线索特征规则库从多个所述目标文本数据中确定疑似非法集资线索数据;将所述疑似非法集资线索数据输入至至少一个已训练的非法集资线索分类模型,得到至少一个预测参数;依据所述疑似非法集资线索数据与所述疑似非法集资线索数据对应的至少一个所述预测参数构建非法集资线索数据库。由此,可以提高从海量互联网数据中筛选非法集资线索数据的效率,以及提高最终筛选出的非法集资线索数据的准确性、全面性。
-
-
-
-
-
-
-
-
-