-
公开(公告)号:CN116702022A
公开(公告)日:2023-09-05
申请号:CN202310512618.5
申请日:2023-05-08
Applicant: 国家计算机网络与信息安全管理中心
Inventor: 李林 , 李美燕 , 王秀文 , 崔雨涵 , 陈鹏云 , 杨菁林 , 徐丹丹 , 秦韬 , 郭富民 , 刘志丞 , 李娅强 , 曾宣玮 , 张栋 , 王峰 , 李政达 , 李东明 , 秦恺
IPC: G06F18/241 , G06F18/23 , G06Q30/0601
Abstract: 本发明实施例涉及一种商品分类模型训练方法、装置、计算机设备及存储介质,该方法包括:根据特征提取模型提取商品集合中每个商品的第一特征,得到第一特征集合,所述第一特征用于表征所述商品的商品特征和所述商品对应的企业特征;对所述第一特征集合进行聚类处理,得到多个簇,每个所述簇中包含多个所述第一特征;从每个所述簇中提取多个目标第一特征,得到目标第一特征集合;根据所述目标第一特征集合对第一初始模型进行训练,得到训练好的商品分类模型。由此,可以实现通过商品特征和企业特征结合进行分类模型的训练,提高了分类的准确度,且对训练的特征进行了筛选,提高模型训练效率。
-
公开(公告)号:CN115827871A
公开(公告)日:2023-03-21
申请号:CN202211690035.3
申请日:2022-12-27
Applicant: 国家计算机网络与信息安全管理中心 , 长城计算机软件与系统有限公司
IPC: G06F16/35 , G06N3/08 , G06F18/241 , G06N3/0464
Abstract: 本发明提供了一种互联网企业分类的方法和装置,其中该方法包括:S1:获取互联网企业的多维度数据,并对所述多维度数据预处理以生成长文本数据;S2:将所述长文本数据输入基于Transformer编码器的Bert网络模型进行处理;S3:将经过处理后的数据送入分类器来对所述互联网企业进行分类。本发明的方案基于在Transformer架构的深度神经网络中进行自动特征组合学习,能够对互联网企业准确进行行业分类,并能够极大提升互联网企业行业分类的准确率。本发明的方案能够快速将海量企业多维度信息进行识别,无需人工干预。本发明的方案基于大语料预训练模型加下游任务微调的方案能灵活应用在不同场景中海量企业的快速分类。
-
公开(公告)号:CN115374325A
公开(公告)日:2022-11-22
申请号:CN202210614028.9
申请日:2022-05-31
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/906 , G06N3/04 , G06N3/08 , G06V10/764 , G06V10/80 , G06V10/82
Abstract: 本发明实施例涉及一种网站分类方法、装置、分类设备及存储介质,所述方法包括:在提取网站中的文本信息时,对所述文本信息进行预处理,获得文本数据集;在提取网站中的图像信息时,对所述图像信息进行预处理,获得图像数据集;对所述文本数据集进行特征提取,获得文本特征向量;对所述图像数据集进行特征提取,获得图像特征向量;基于Bert‑ResNet融合模型对获取的所述文本特征向量和所述图像特征向量进行信息融合,得到相应的融合结果,所述融合结果表征所述网站的分类结果;通过将文本信息和图像信息在Bert‑ResNet融合模型中进行融合处理,实现文本信息和图像信息互补的多模态网站分类处理,提高网站分类的准确率的技术效果。
-
公开(公告)号:CN112801788A
公开(公告)日:2021-05-14
申请号:CN202110072819.9
申请日:2021-01-20
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06Q40/04
Abstract: 本发明公开了一种互联网股权融资平台监控系统及监控方法,包括以下模块:规则管理模块:用于设定和维护互联网股权融资规则;数据预处理模块:用于采集或导入信息,并将信息标准化处理后存入数据库;平台发现模块:通过分析互联网公开信息,根据规则管理模块发现互联网股权融资平台;风险计算分析处理模块:用于规则管理模块对互联网股权融资平台进行风险指标分析以及对监测范围内互联网股权融资平台进行综合分析和评级;预警通知模块:用于将判定有风险的互联网股权融资平台进行预警通知;综合展示模块:采用可视化页面展示风险平台地域分布、数量分布等信息。本发明的有益效果为:全面提升互联网股权融资平台的监测能力。
-
公开(公告)号:CN112182020A
公开(公告)日:2021-01-05
申请号:CN202011184465.9
申请日:2020-10-29
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/242 , G06F40/289 , G06Q30/06 , G06Q30/08 , G06Q40/02 , G06Q40/04 , G06Q40/06 , G06N3/04
Abstract: 本申请涉及一种金融行为识别与分类的方法、装置及计算机可读存储介质。其中,方法包括:从至少两个数据源获取多源数据文本,然后按照预先设定的数据处理方式对数据文本进行预处理,得到各数据文本的向量,将各所述数据文本的向量输入到预先训练的多尺度卷积神经网络模型中,根据数据源的类型确定各所述数据文本的向量的卷积核,再利用各自的卷积核提取各向量的语义特征,从而根据各向量的语义特征确定各预设金融行为的概率,最后再根据各预设金融行为的概率确定多源数据文本对应的金融行为。多数据源能够体现出目标金融机构各个方面的实际开展的业务,从而能够更为准确地识别出目标金融机构实际的金融行为,更加便于监管。
-
公开(公告)号:CN110276680A
公开(公告)日:2019-09-24
申请号:CN201910441730.8
申请日:2019-05-24
Applicant: 国家计算机网络与信息安全管理中心 , 北京赛思信安技术股份有限公司
IPC: G06Q40/02
Abstract: 本发明公开了一种应用于互联网金融的真实数据获取方法,涉及国家互联网金融监测领域。首先梳理各网贷机构业务的交易明细数据,进行业务评估;各网贷机构在本地存储一份符合标准的数据,并进行自查,将自查的数据接入国家互联网应急中心。然后各网贷机构通过SDK工具包进行埋点,国家互联网应急中心对各网贷机构实时接入的交易明细数据进行正确性验证,并反馈给网贷机构;同时抽取各网贷机构接入的实时交易数据,按出借和借款业务形成数据流,围绕出借人和借款人两个维度生成披露数据。最后国家互联网应急中心对用户开放数据查验,查验反馈窗口。本发明实现对网贷机构实时接入数据的真实性验证以及进行实时、动态监管的目的。
-
公开(公告)号:CN111401448B
公开(公告)日:2024-05-24
申请号:CN202010183470.1
申请日:2020-03-16
Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
IPC: G06F40/284
Abstract: 本发明提供了一种交易平台分类方法和装置,包括步骤:数据采集,接收第一数据,根据第一数据获取第二数据,所述第二数据包括自然语言,对所述第二数据进行第一预处理,生成第三数据;数据处理,对所述第三数据进行分析,根据数据相关度,判定所述第三数据为第一类数据或第二类数据;分类模型建立,将所述第一类数据和第二类数据根据样本数和学习率建立分类模型;平台分类,接收平台数据和所述第三数据,将所述第三数据输入所述分类模型,判定所述第三数据为第一类数据或第二类数据;分析平台数据,判定与所述平台数据相关的第三数据。通过数据采集,数据处理,分类模型建立,平台分类,判断平台为场内或场外平台。
-
公开(公告)号:CN111861119B
公开(公告)日:2023-07-11
申请号:CN202010555450.2
申请日:2020-06-17
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
IPC: G06Q10/0635 , G06F16/901
Abstract: 本申请涉及一种基于企业风险关联图谱的企业风险数据处理方法及装置。该方法包括:获取企业风险关联图谱并确定第一目标节点,企业风险关联图谱用于保存企业之间的风险传播关系,第一目标节点为企业风险关联图谱中的节点,用于表示出现风险问题的风险企业;利用企业风险关联图谱确定与第一目标节点关联的第二目标节点的风险参数,第二目标节点为企业风险关联图谱中的节点,用于表示与风险企业存在关联关系的企业,风险参数用于表示与风险企业存在关联关系的企业受风险企业影响的概率。本申请实现了从企业关联关系的角度分析其他企业受风险企业影响的概率,提供了评估企业之间风险传播的更为准确、形象的方法。
-
公开(公告)号:CN112182020B
公开(公告)日:2023-04-18
申请号:CN202011184465.9
申请日:2020-10-29
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F18/214 , G06F18/2415 , G06F40/289 , G06F40/30 , G06Q30/0645 , G06Q30/08 , G06Q40/03 , G06Q40/04 , G06Q40/06 , G06N3/0464 , G06N3/08
Abstract: 本申请涉及一种金融行为识别与分类的方法、装置及计算机可读存储介质。其中,方法包括:从至少两个数据源获取多源数据文本,然后按照预先设定的数据处理方式对数据文本进行预处理,得到各数据文本的向量,将各所述数据文本的向量输入到预先训练的多尺度卷积神经网络模型中,根据数据源的类型确定各所述数据文本的向量的卷积核,再利用各自的卷积核提取各向量的语义特征,从而根据各向量的语义特征确定各预设金融行为的概率,最后再根据各预设金融行为的概率确定多源数据文本对应的金融行为。多数据源能够体现出目标金融机构各个方面的实际开展的业务,从而能够更为准确地识别出目标金融机构实际的金融行为,更加便于监管。
-
公开(公告)号:CN115439204A
公开(公告)日:2022-12-06
申请号:CN202211080195.6
申请日:2022-09-05
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06Q40/00
Abstract: 本公开涉及一种区域非法集资风险评估设备。该设备获取到目标区域已注册企业的企业信息、系统判定的企业风险预警指数、人工判定的企业风险预警指数及已发生的非法集资案件信息后,根据上述信息确定目标区域已发生非法集资案件的企业对应的第一风险指数、已发生非法集资案件的除企业外的其他主体对应的第二风险指数、由人工判定了企业风险预警指数的企业对应的第三风险指数及由系统判定了企业风险预警指数的企业对应的第四风险指数,并根据上述各风险指数确定综合风险指数,使得可以通过设备自动化的对区域的非法集资风险进行量化评估,减少了人员对非法集资风险评估的参与,既提高了非法集资风险评估的准确性,又提高了非法集资风险评估的效率。
-
-
-
-
-
-
-
-
-