-
公开(公告)号:CN116702022A
公开(公告)日:2023-09-05
申请号:CN202310512618.5
申请日:2023-05-08
Applicant: 国家计算机网络与信息安全管理中心
Inventor: 李林 , 李美燕 , 王秀文 , 崔雨涵 , 陈鹏云 , 杨菁林 , 徐丹丹 , 秦韬 , 郭富民 , 刘志丞 , 李娅强 , 曾宣玮 , 张栋 , 王峰 , 李政达 , 李东明 , 秦恺
IPC: G06F18/241 , G06F18/23 , G06Q30/0601
Abstract: 本发明实施例涉及一种商品分类模型训练方法、装置、计算机设备及存储介质,该方法包括:根据特征提取模型提取商品集合中每个商品的第一特征,得到第一特征集合,所述第一特征用于表征所述商品的商品特征和所述商品对应的企业特征;对所述第一特征集合进行聚类处理,得到多个簇,每个所述簇中包含多个所述第一特征;从每个所述簇中提取多个目标第一特征,得到目标第一特征集合;根据所述目标第一特征集合对第一初始模型进行训练,得到训练好的商品分类模型。由此,可以实现通过商品特征和企业特征结合进行分类模型的训练,提高了分类的准确度,且对训练的特征进行了筛选,提高模型训练效率。
-
公开(公告)号:CN118734928A
公开(公告)日:2024-10-01
申请号:CN202410629625.8
申请日:2024-05-21
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本公开涉及一种微调指令的构造方法、装置、设备及介质,该方法包括:将负面文本样本的标签划分为多个级别的目标分类标签;基于目标分类标签,使用预设的大模型对负面文本样本构造初始微调指令数据;在检查待微调的目标模型无法遵循初始微调指令数据的情况下,将初始微调指令数据修改为目标微调指令数据。本公开针对从知识库或网络上中搜索到负面文本样本,先划分目标分类标签,在基于此构造初始微调指令数据,其中,对于模型不能理解指令的问题,本实施例可以检查目标模型是否能遵循初始微调指令数据,并在无法遵循的情况下,将初始微调指令数据修改为目标微调指令数据,由此得到的目标微调指令能够使文本分类任务更好的拟合预训练目标模型的知识,提高了微调指令的可用性。
-
公开(公告)号:CN111914542A
公开(公告)日:2020-11-10
申请号:CN202010437168.4
申请日:2020-05-21
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
IPC: G06F40/279 , G06F40/216 , G06Q40/02 , G06Q50/26
Abstract: 本申请实施例提供了疑似非法集资市场主体识别方法、装置、终端及存储介质,涉及金融安全领域。本申请通过从互联网公开数据中获取与市场主体相关联的文本数据;通过预先训练的数据识别模型,从文本数据中识别出非法集资线索数据;将非法集资线索数据输入到预先训练的市场主体抽取模型中,得到疑似非法集资市场主体。本方案可以从互联网公开数据中自动识别出疑似非法集资行为的线索信息,定位疑似非法集资市场主体,从而提高识别非法集资市场主体的效率。
-
公开(公告)号:CN109919414A
公开(公告)日:2019-06-21
申请号:CN201910039691.9
申请日:2019-01-16
Applicant: 国家计算机网络与信息安全管理中心 , 北京邮电大学
Abstract: 本发明提供一种P2P网络借贷平台风险分析方法、装置及存储介质,该方法包括:获取第一P2P网络借贷平台中的第一借款人的标识;获取至少一个第二P2P网络借贷平台发布的借贷信息,借贷信息包括在第二P2P网络借贷平台上的至少一个第二借款人的标识以及至少一个第二借款人的借款信息;根据借贷信息与第一借款人的标识,判断第一借款人在第二P2P网络借贷平台中是否存在借款;根据判断第一借款人在第二P2P网络借贷平台中是否存在借款的结果,生成检测报告,实现了判断用户是否存在向其他P2P网络借贷平台借款的情况,进而降低了借贷风险。
-
公开(公告)号:CN119940360A
公开(公告)日:2025-05-06
申请号:CN202510203852.9
申请日:2025-02-24
Applicant: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司
IPC: G06F40/284 , G06F40/216 , G06F40/166 , G06F16/35 , G06N3/045 , G06N3/08
Abstract: 本发明提供了一种基于大语言模型的企业文本数据多维处理方法和电子设备,包括:获取待处理文本数据中的关键词和对应的权重,并将获取的关键词按照权重由大到小的顺序进行重排序,得到排序后的关键词;为排序后的关键词赋予新权重,作为该关键词的最终权重;基于每个关键词对应的最终权重,从待处理文本数据中获取对应的上下文内容,作为对应的文本片段;利用多个文本分类模型对每个文本片段的类别标签进行预测,类别标签包括表征文本数据为正常文本数据的第一标签和表征文本数据为异常文本数据的第二标签。本发明基于关键词抽取和重排序进行数据处理,融合多种方式进行多维度分类,能够提高异常文本数据识别的准确率和增强泛化能力和鲁棒性。
-
公开(公告)号:CN114819432B
公开(公告)日:2025-04-11
申请号:CN202110065882.X
申请日:2021-01-18
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06Q10/0635
Abstract: 本发明实施例涉及一种企业非法集资风险预测方法、装置、电子设备及存储介质,所述方法包括:获取待进行非法集资风险预测的目标企业的企业数据;对所述企业数据进行特征提取,得到所述目标企业的企业特征;将所述企业特征输入至至少一个已训练的非法集资风险预测模型,得到至少一个所述目标企业非法集资的风险概率;根据至少一个所述目标企业非法集资的风险概率确定所述目标企业是否存在非法集资风险。由此,可以提高对企业非法集资风险进行预测的预测结果的准确性。
-
公开(公告)号:CN114817485B
公开(公告)日:2024-09-06
申请号:CN202110078586.3
申请日:2021-01-20
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/332 , G06F16/35 , G06F18/241
Abstract: 本发明实施例涉及一种非法集资线索识别方法、装置、电子设备及存储介质,所述方法包括:获取多个待进行非法集资线索识别的目标文本数据;基于预设的线索特征规则库从多个所述目标文本数据中确定疑似非法集资线索数据;将所述疑似非法集资线索数据输入至至少一个已训练的非法集资线索分类模型,得到至少一个预测参数;依据所述疑似非法集资线索数据与所述疑似非法集资线索数据对应的至少一个所述预测参数构建非法集资线索数据库。由此,可以提高从海量互联网数据中筛选非法集资线索数据的效率,以及提高最终筛选出的非法集资线索数据的准确性、全面性。
-
公开(公告)号:CN117609497A
公开(公告)日:2024-02-27
申请号:CN202311343043.5
申请日:2023-10-17
Applicant: 国家计算机网络与信息安全管理中心 , 中网数安(北京)科技有限公司 , 联洋国融(北京)科技有限公司
IPC: G06F16/35 , G06F18/214 , G06F18/22 , G06F18/2431
Abstract: 本发明提供一种文本有害内容无监督识别方法及装置。所述方法包括:获取待识别的多个文本,计算每个待识别文本的特征向量;计算有害文本分类库中每个有害文本类别的特征向量,有害文本分类库包括每种有害文本类别的标识词;计算待识别文本的特征向量与每个有害文本类别的特征向量的相似度,若所述相似度的最大值超过设定阈值,则所述最大值对应的有害文本类别为所述待识别文本的类别。本发明通过构建有害文本分类库,并通过相似度计算,能够对文本中的有害内容进行无监督识别,解决了基于有监督学习的现有识别方法存在的需要不断地对新的大量文本数据进行标注,耗费大量的人工和时间的问题。
-
公开(公告)号:CN115271324A
公开(公告)日:2022-11-01
申请号:CN202210649136.X
申请日:2022-06-09
Applicant: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司
IPC: G06Q10/06
Abstract: 本公开实施例提供一种集团风险监测预警方法、装置、设备和存储介质。集团风险预警方法,包括:确定集团包含的企业,以及集团内企业之间的关联关系;根据所述关联关系,基于所述集团内问题企业的第一风险指数进行风险传导,确定所述集团内企业的第二风险指数;基于所述集团内企业的第二风险指数,确定是否触发对所述集团的风险预警。采用本公开实施例提供的方案能够实现自动的集团风险预警,提高了风险预警的实时性。
-
公开(公告)号:CN114861661A
公开(公告)日:2022-08-05
申请号:CN202110077227.6
申请日:2021-01-20
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/295 , G06N3/04 , G06N3/08 , G06Q40/00
Abstract: 本申请涉及一种实体识别方法、装置、设备及存储介质。该方法包括获取非法集资线索数据;确定与非法集资线索数据对应的字向量序列;利用预先训练得到的BiLSTM‑CRF模型对字向量序列进行推理,得到与非法集资线索数据对应的标签序列;从标签序列中提取属于实体标签的目标标签,并将目标标签对应的数据作为非法集资线索数据中的非法集资线索实体。可见,采用本申请的技术方案实现了对非法集资线索实体的自动识别,不仅识别效率高,且可以做到实时识别。
-
-
-
-
-
-
-
-
-