-
公开(公告)号:CN114817485A
公开(公告)日:2022-07-29
申请号:CN202110078586.3
申请日:2021-01-20
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/332 , G06F16/35 , G06K9/62
Abstract: 本发明实施例涉及一种非法集资线索识别方法、装置、电子设备及存储介质,所述方法包括:获取多个待进行非法集资线索识别的目标文本数据;基于预设的线索特征规则库从多个所述目标文本数据中确定疑似非法集资线索数据;将所述疑似非法集资线索数据输入至至少一个已训练的非法集资线索分类模型,得到至少一个预测参数;依据所述疑似非法集资线索数据与所述疑似非法集资线索数据对应的至少一个所述预测参数构建非法集资线索数据库。由此,可以提高从海量互联网数据中筛选非法集资线索数据的效率,以及提高最终筛选出的非法集资线索数据的准确性、全面性。
-
公开(公告)号:CN113743111A
公开(公告)日:2021-12-03
申请号:CN202010865079.X
申请日:2020-08-25
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本申请涉及一种基于文本预训练和多任务学习的金融风险预测方法及装置。该方法包括:获取待处理文本;将待处理文本输入第一神经网络模型,以按照风险识别任务的处理流程确定待处理文本的内容是否包括金融风险;在待处理文本的内容包括金融风险的情况下,利用第一神经网络模型按照风险分类任务的处理流程确定金融风险的风险类型;利用第一神经网络模型按照风险主体识别任务的处理流程确定与风险类型匹配的风险主体。本申请通过预训练语言模型技术解决了缺乏对语义的深度挖掘导致模型性能不佳的问题,并采用多任务处理,解决了数据量有限而且任务之间无法进行信息共享导致模型性能不佳的技术问题。
-
公开(公告)号:CN107944559B
公开(公告)日:2021-04-27
申请号:CN201711190865.9
申请日:2017-11-24
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及一种实体关系自动识别方法及系统,该方法包括:训练卷积神经网络得到实体关系识别模型;获取对应待确认实体组的相关语料库;将相关语料进行分词,并将分词得到的相关词语转化为相关词向量;将相关词向量按相关语料转化为矩阵作为实体关系识别模型的输入,得到相关关系种类和相关关系种类的相似度值,将相似度值高的相关关系种类作为待确认实体组的关系种类。本发明通过锻炼卷积神经网络作为实体关系识别模型,在出现新增实体时,计算得到一系列新增实体组的关系种类,并得出每一项关系种类的相似度值,通过具体的数值来确定相关关系种类的程度,提高得到的新增实体组之间关系种类的准确性。
-
公开(公告)号:CN111861120A
公开(公告)日:2020-10-30
申请号:CN202010556321.5
申请日:2020-06-17
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
Abstract: 本申请涉及一种企业关联图谱的构建方法、装置、设备及计算机可读介质。该方法包括:获取目标数据集,目标数据集包括多个目标企业的数据,每条数据包括一个目标企业的关联特征;将多个目标企业中具有相同的关联特征的企业划分到同一个企业组中;为多个目标企业建立图谱节点,并按照关联类型为企业组中的图谱节点构建节点与节点之间的关联边;利用关联系数和关联权重确定关联边的关联强度。本申请实现了企业关联图谱的构建,利用企业关联图谱表示了企业之间存在的各种关联关系及企业之间的关联强度,为企业间风险传播的评估提供了基础。
-
公开(公告)号:CN111861119A
公开(公告)日:2020-10-30
申请号:CN202010555450.2
申请日:2020-06-17
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
IPC: G06Q10/06
Abstract: 本申请涉及一种基于企业风险关联图谱的企业风险数据处理方法及装置。该方法包括:获取企业风险关联图谱并确定第一目标节点,企业风险关联图谱用于保存企业之间的风险传播关系,第一目标节点为企业风险关联图谱中的节点,用于表示出现风险问题的风险企业;利用企业风险关联图谱确定与第一目标节点关联的第二目标节点的风险参数,第二目标节点为企业风险关联图谱中的节点,用于表示与风险企业存在关联关系的企业,风险参数用于表示与风险企业存在关联关系的企业受风险企业影响的概率。本申请实现了从企业关联关系的角度分析其他企业受风险企业影响的概率,提供了评估企业之间风险传播的更为准确、形象的方法。
-
公开(公告)号:CN111680225A
公开(公告)日:2020-09-18
申请号:CN202010338132.0
申请日:2020-04-26
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9536 , G06F16/35 , G06F40/30 , G06F40/289 , G06N3/04
Abstract: 本发明公开了一种基于机器学习的微信消息分析方法,包括:步骤一、构建训练语料库;步骤二、建立词汇向量表;步骤三和步骤四、构建和训练卷积神经网络;步骤五、将待分析的微信消息对应的多个词汇对应的词向量构成的词向量矩阵输入至训练得到的卷积神经网络,输出得到该微信消息对应的所有标签的概率分布情况。本发明具有精准预测微信消息所属的金融分类标签的有益效果。本方法还公开了一种基于机器学习的微信消息分析系统,包括:数据采集组件;训练语料库;文本预处理组件;模型训练组件;源数据分类组件。本系统具有精准预测微信消息所属的金融分类标签的有益效果。
-
公开(公告)号:CN111666267A
公开(公告)日:2020-09-15
申请号:CN201910165555.4
申请日:2019-03-05
Applicant: 国家计算机网络与信息安全管理中心 , 北京梆梆安全科技有限公司
IPC: G06F16/215
Abstract: 本申请公开了一种数据清洗方法、装置及终端设备,该方法包括:获取待存入数据库的目标数据的数据标识;将所述目标数据的数据标识插入Redis存储系统的set集合,其中所述set集合中包括所述数据库中各数据分别对应的数据标识;当所述目标数据的数据标识插入失败时,删除所述目标数据。本申请解决了现有技术的数据清洗方式去重效率低,且难以在数据量级较大的场景下使用的问题。
-
公开(公告)号:CN111401450A
公开(公告)日:2020-07-10
申请号:CN202010184062.8
申请日:2020-03-16
Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
IPC: G06K9/62 , G06F40/284 , G06Q40/04
Abstract: 本发明提供了一种交易场所分类方法和装置,包括步骤:接收第一数据,根据第一数据获取第二数据,所述第二数据为文本数据,对所述第二数据进行标记处理,生成第三数据;对所述第三数据进行第二预处理,得出第四数据,将所述第四数据进行转换,得出第五数据,根据所述第五数据,生成第一模型;将所述第五数据划分为第一部分和第二部分,将所述第一部分导入第一库生成所述第一边界,将所述第二部分导入验证,得出第二模型;接收场所信息,将所述场所信息进行所述第二预处理得出所述第一信息,将所述第一信息导入所述第二模型,得出场所类别。通过分界线判断所述场所类别,在直观而且快捷的同时,提高所述场所类别的划分准确性。
-
公开(公告)号:CN111369369A
公开(公告)日:2020-07-03
申请号:CN202010184061.3
申请日:2020-03-16
Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
Abstract: 本发明提供了一种微盘交易平台监控系统,包括:规则管理模块,用于设定、维护微盘交易平台违法违规判定规则、决策分析规则;数据处理模块,用于采集或导入微盘交易平台信息,并将信息标准化后存入数据库;违规分析处理模块:用于根据违法违规判定规则对微盘交易平台进行判定分析;决策分析模块:用于根据决策分析规则,对微盘平台进行综合分析和评级;预警通知模块:用于将判定有风险的微盘交易平台进行预警通知;本发明还提供了一种微盘交易平台监控方法,对微盘交易平台进行监管,及时发现违法违规的微盘交易平台,进行示警,用户根据示警信息能及时知悉违法违规的微盘交易平台,能根据示警信息及时对违法违规的微盘交易平台进行处理。
-
公开(公告)号:CN111160005A
公开(公告)日:2020-05-15
申请号:CN201911168831.9
申请日:2019-11-25
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/211 , G06F40/289 , G06F40/30 , G06F16/36 , G06N3/04 , G06N3/08
Abstract: 本申请涉及一种基于事件演化知识本体的事件预测方法、装置及终端设备。其中,该方法包括:通过构建具备事件演化关系的事件演化本体知识库,从事件演化本体知识库中抽取出第一事件链和第一事件元组,采用远程监督的方式,利用第一事件元组和第一事件链对非结构化文本进行关系数据回标,得到具有事件演化关系的事件数据,利用事件数据训练以建立事件预测模型的方法,可以基于知识有效的快速获得大量已标注的训练数据,从而有效提升事件预测的准确度。
-
-
-
-
-
-
-
-
-