-
公开(公告)号:CN113743111A
公开(公告)日:2021-12-03
申请号:CN202010865079.X
申请日:2020-08-25
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本申请涉及一种基于文本预训练和多任务学习的金融风险预测方法及装置。该方法包括:获取待处理文本;将待处理文本输入第一神经网络模型,以按照风险识别任务的处理流程确定待处理文本的内容是否包括金融风险;在待处理文本的内容包括金融风险的情况下,利用第一神经网络模型按照风险分类任务的处理流程确定金融风险的风险类型;利用第一神经网络模型按照风险主体识别任务的处理流程确定与风险类型匹配的风险主体。本申请通过预训练语言模型技术解决了缺乏对语义的深度挖掘导致模型性能不佳的问题,并采用多任务处理,解决了数据量有限而且任务之间无法进行信息共享导致模型性能不佳的技术问题。
-
公开(公告)号:CN113505221A
公开(公告)日:2021-10-15
申请号:CN202010214386.1
申请日:2020-03-24
Applicant: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司 , 北京中科闻歌智安科技有限公司
Abstract: 本发明公开了一种企业虚假宣传风险识别方法、设备和存储介质。该方法包括:在目标企业对应的多个企业舆情文本中,提取疑似风险文本;在每个疑似风险文本中提取对应种类的风险特征,形成每个疑似风险文本对应的风险特征向量;将多个疑似风险文本分别对应的风险特征向量顺次输入预先训练的风险识别模型,使风险识别模型对每个疑似风险文本进行识别,并将识别为存在虚假宣传风险的疑似风险文本确定为风险文本;根据确定出的所有风险文本的信息,确定目标企业对应的虚假宣传风险强度值;如果虚假宣传风险强度值大于预设的风险阈值,则确定目标企业存在虚假宣传风险。本发明可以避免人工匹配规则的局限性,提升了虚假宣传风险识别的准确性。
-
公开(公告)号:CN107944559B
公开(公告)日:2021-04-27
申请号:CN201711190865.9
申请日:2017-11-24
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及一种实体关系自动识别方法及系统,该方法包括:训练卷积神经网络得到实体关系识别模型;获取对应待确认实体组的相关语料库;将相关语料进行分词,并将分词得到的相关词语转化为相关词向量;将相关词向量按相关语料转化为矩阵作为实体关系识别模型的输入,得到相关关系种类和相关关系种类的相似度值,将相似度值高的相关关系种类作为待确认实体组的关系种类。本发明通过锻炼卷积神经网络作为实体关系识别模型,在出现新增实体时,计算得到一系列新增实体组的关系种类,并得出每一项关系种类的相似度值,通过具体的数值来确定相关关系种类的程度,提高得到的新增实体组之间关系种类的准确性。
-
公开(公告)号:CN111680225A
公开(公告)日:2020-09-18
申请号:CN202010338132.0
申请日:2020-04-26
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9536 , G06F16/35 , G06F40/30 , G06F40/289 , G06N3/04
Abstract: 本发明公开了一种基于机器学习的微信消息分析方法,包括:步骤一、构建训练语料库;步骤二、建立词汇向量表;步骤三和步骤四、构建和训练卷积神经网络;步骤五、将待分析的微信消息对应的多个词汇对应的词向量构成的词向量矩阵输入至训练得到的卷积神经网络,输出得到该微信消息对应的所有标签的概率分布情况。本发明具有精准预测微信消息所属的金融分类标签的有益效果。本方法还公开了一种基于机器学习的微信消息分析系统,包括:数据采集组件;训练语料库;文本预处理组件;模型训练组件;源数据分类组件。本系统具有精准预测微信消息所属的金融分类标签的有益效果。
-
公开(公告)号:CN111666267A
公开(公告)日:2020-09-15
申请号:CN201910165555.4
申请日:2019-03-05
Applicant: 国家计算机网络与信息安全管理中心 , 北京梆梆安全科技有限公司
IPC: G06F16/215
Abstract: 本申请公开了一种数据清洗方法、装置及终端设备,该方法包括:获取待存入数据库的目标数据的数据标识;将所述目标数据的数据标识插入Redis存储系统的set集合,其中所述set集合中包括所述数据库中各数据分别对应的数据标识;当所述目标数据的数据标识插入失败时,删除所述目标数据。本申请解决了现有技术的数据清洗方式去重效率低,且难以在数据量级较大的场景下使用的问题。
-
公开(公告)号:CN111401450A
公开(公告)日:2020-07-10
申请号:CN202010184062.8
申请日:2020-03-16
Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
IPC: G06K9/62 , G06F40/284 , G06Q40/04
Abstract: 本发明提供了一种交易场所分类方法和装置,包括步骤:接收第一数据,根据第一数据获取第二数据,所述第二数据为文本数据,对所述第二数据进行标记处理,生成第三数据;对所述第三数据进行第二预处理,得出第四数据,将所述第四数据进行转换,得出第五数据,根据所述第五数据,生成第一模型;将所述第五数据划分为第一部分和第二部分,将所述第一部分导入第一库生成所述第一边界,将所述第二部分导入验证,得出第二模型;接收场所信息,将所述场所信息进行所述第二预处理得出所述第一信息,将所述第一信息导入所述第二模型,得出场所类别。通过分界线判断所述场所类别,在直观而且快捷的同时,提高所述场所类别的划分准确性。
-
公开(公告)号:CN111369369A
公开(公告)日:2020-07-03
申请号:CN202010184061.3
申请日:2020-03-16
Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
Abstract: 本发明提供了一种微盘交易平台监控系统,包括:规则管理模块,用于设定、维护微盘交易平台违法违规判定规则、决策分析规则;数据处理模块,用于采集或导入微盘交易平台信息,并将信息标准化后存入数据库;违规分析处理模块:用于根据违法违规判定规则对微盘交易平台进行判定分析;决策分析模块:用于根据决策分析规则,对微盘平台进行综合分析和评级;预警通知模块:用于将判定有风险的微盘交易平台进行预警通知;本发明还提供了一种微盘交易平台监控方法,对微盘交易平台进行监管,及时发现违法违规的微盘交易平台,进行示警,用户根据示警信息能及时知悉违法违规的微盘交易平台,能根据示警信息及时对违法违规的微盘交易平台进行处理。
-
公开(公告)号:CN111160005A
公开(公告)日:2020-05-15
申请号:CN201911168831.9
申请日:2019-11-25
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/211 , G06F40/289 , G06F40/30 , G06F16/36 , G06N3/04 , G06N3/08
Abstract: 本申请涉及一种基于事件演化知识本体的事件预测方法、装置及终端设备。其中,该方法包括:通过构建具备事件演化关系的事件演化本体知识库,从事件演化本体知识库中抽取出第一事件链和第一事件元组,采用远程监督的方式,利用第一事件元组和第一事件链对非结构化文本进行关系数据回标,得到具有事件演化关系的事件数据,利用事件数据训练以建立事件预测模型的方法,可以基于知识有效的快速获得大量已标注的训练数据,从而有效提升事件预测的准确度。
-
公开(公告)号:CN106294336B
公开(公告)日:2020-02-14
申请号:CN201510236795.0
申请日:2015-05-11
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9535
Abstract: 本发明公开一种用于微博的突发特征检测方法及装置,涉及网络信息挖掘技术领域,用以解决现有技术中微博信息噪音大、数据多样突发特征检测准确率低的问题。所述方法包括:根据信息流中有意义串的被检特征的瞬时爆发情况,检测出候选突发特征;将所述候选突发特征中的频繁伪突发特征和间歇性伪突发特征滤除。
-
公开(公告)号:CN106294335B
公开(公告)日:2020-01-14
申请号:CN201510236792.7
申请日:2015-05-11
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9536
Abstract: 本发明要解决的技术问题是提供一种用于微博的热点话题检测方法及装置,涉及网络信息挖掘技术领域,能够解决特征高度稀疏的微博文本热点话题检测困难的问题。所述方法包括:提取信息流中的有意义串并对所述有意义串进行热度分析,以从中筛选出热点特征;根据信息瓶颈理论对所述热点特征进行特征合并,并且计算合并后的合并程度指示参数;根据所述合并程度指示参数确定热点话题。
-
-
-
-
-
-
-
-
-