-
公开(公告)号:CN116127964A
公开(公告)日:2023-05-16
申请号:CN202211600947.7
申请日:2022-12-13
Applicant: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司 , 国家计算机网络与信息安全管理中心天津分中心
IPC: G06F40/284 , G06F40/30 , G06F16/35 , H04L9/40 , H04W12/12
Abstract: 本发明公开了一种融合传播关系的诈骗信息的检测方法。该方法包括:获取第一信息组、诈骗账号库以及正常账号库,其中第一信息组中的每一个信息包括文本信息和发信账号;根据诈骗账号库和正常账号库从第一信息组中确定第二信息组,其中第二信息组中的每一个信息的发信账号在诈骗账号库和正常账号库中都不存在;根据第二信息组得到多个目标信息组,其中每一个目标信息组中的第一发信账号与第二发信账号的相似文本信息的数量大于第一阈值;计算每一个目标信息组的诈骗权重值;在目标信息组的诈骗权重值大于第二阈值的情况下,将目标信息组中的每一个文本信息确定为诈骗信息。本发明解决了对大量诈骗信息进行检测时,处理效率低的技术问题。
-
公开(公告)号:CN113505221A
公开(公告)日:2021-10-15
申请号:CN202010214386.1
申请日:2020-03-24
Applicant: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司 , 北京中科闻歌智安科技有限公司
Abstract: 本发明公开了一种企业虚假宣传风险识别方法、设备和存储介质。该方法包括:在目标企业对应的多个企业舆情文本中,提取疑似风险文本;在每个疑似风险文本中提取对应种类的风险特征,形成每个疑似风险文本对应的风险特征向量;将多个疑似风险文本分别对应的风险特征向量顺次输入预先训练的风险识别模型,使风险识别模型对每个疑似风险文本进行识别,并将识别为存在虚假宣传风险的疑似风险文本确定为风险文本;根据确定出的所有风险文本的信息,确定目标企业对应的虚假宣传风险强度值;如果虚假宣传风险强度值大于预设的风险阈值,则确定目标企业存在虚假宣传风险。本发明可以避免人工匹配规则的局限性,提升了虚假宣传风险识别的准确性。
-
公开(公告)号:CN119940360A
公开(公告)日:2025-05-06
申请号:CN202510203852.9
申请日:2025-02-24
Applicant: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司
IPC: G06F40/284 , G06F40/216 , G06F40/166 , G06F16/35 , G06N3/045 , G06N3/08
Abstract: 本发明提供了一种基于大语言模型的企业文本数据多维处理方法和电子设备,包括:获取待处理文本数据中的关键词和对应的权重,并将获取的关键词按照权重由大到小的顺序进行重排序,得到排序后的关键词;为排序后的关键词赋予新权重,作为该关键词的最终权重;基于每个关键词对应的最终权重,从待处理文本数据中获取对应的上下文内容,作为对应的文本片段;利用多个文本分类模型对每个文本片段的类别标签进行预测,类别标签包括表征文本数据为正常文本数据的第一标签和表征文本数据为异常文本数据的第二标签。本发明基于关键词抽取和重排序进行数据处理,融合多种方式进行多维度分类,能够提高异常文本数据识别的准确率和增强泛化能力和鲁棒性。
-
公开(公告)号:CN115271324A
公开(公告)日:2022-11-01
申请号:CN202210649136.X
申请日:2022-06-09
Applicant: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司
IPC: G06Q10/06
Abstract: 本公开实施例提供一种集团风险监测预警方法、装置、设备和存储介质。集团风险预警方法,包括:确定集团包含的企业,以及集团内企业之间的关联关系;根据所述关联关系,基于所述集团内问题企业的第一风险指数进行风险传导,确定所述集团内企业的第二风险指数;基于所述集团内企业的第二风险指数,确定是否触发对所述集团的风险预警。采用本公开实施例提供的方案能够实现自动的集团风险预警,提高了风险预警的实时性。
-
公开(公告)号:CN113505221B
公开(公告)日:2024-03-12
申请号:CN202010214386.1
申请日:2020-03-24
Applicant: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司 , 国科智安(北京)科技有限公司
IPC: G06F16/35 , G06F18/2411 , G06Q30/018
Abstract: 本发明公开了一种企业虚假宣传风险识别方法、设备和存储介质。该方法包括:在目标企业对应的多个企业舆情文本中,提取疑似风险文本;在每个疑似风险文本中提取对应种类的风险特征,形成每个疑似风险文本对应的风险特征向量;将多个疑似风险文本分别对应的风险特征向量顺次输入预先训练的风险识别模型,使风险识别模型对每个疑似风险文本进行识别,并将识别为存在虚假宣传风险的疑似风险文本确定为风险文本;根据确定出的所有风险文本的信息,确定目标企业对应的虚假宣传风险强度值;如果虚假宣传风险强度值大于预设的风险阈值,则确定目标企业存在虚假宣传风险。本发明可以避免人工匹配规则的局限性,提升了虚假宣传风险识别的准确性。
-
公开(公告)号:CN110119882A
公开(公告)日:2019-08-13
申请号:CN201910296002.2
申请日:2019-04-12
Applicant: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司
Abstract: 本申请涉及一种平台风险监控方法、装置、设备及存储介质,该方法包括:获取与业务数据对应的风险指数评估模型;从所述业务数据中获取风险点类别信息;利用所述风险指数评估模型,对所述风险点类别信息进行风险评估,得到所述风险点类别信息的风险指数评估结果。该方法可以缓解单靠人力对每个融资平台的风险进行有效监控的难度,达到了提高平台风险监控效率的技术效果。
-
公开(公告)号:CN118734928A
公开(公告)日:2024-10-01
申请号:CN202410629625.8
申请日:2024-05-21
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本公开涉及一种微调指令的构造方法、装置、设备及介质,该方法包括:将负面文本样本的标签划分为多个级别的目标分类标签;基于目标分类标签,使用预设的大模型对负面文本样本构造初始微调指令数据;在检查待微调的目标模型无法遵循初始微调指令数据的情况下,将初始微调指令数据修改为目标微调指令数据。本公开针对从知识库或网络上中搜索到负面文本样本,先划分目标分类标签,在基于此构造初始微调指令数据,其中,对于模型不能理解指令的问题,本实施例可以检查目标模型是否能遵循初始微调指令数据,并在无法遵循的情况下,将初始微调指令数据修改为目标微调指令数据,由此得到的目标微调指令能够使文本分类任务更好的拟合预训练目标模型的知识,提高了微调指令的可用性。
-
公开(公告)号:CN118627581A
公开(公告)日:2024-09-10
申请号:CN202410753364.0
申请日:2024-06-12
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06N3/082 , G06N3/045 , G06N3/0499 , G06N3/084
Abstract: 本发明属于人工智能技术领域,涉及一种基于输入激活的大语言模型低秩近似剪枝方法和装置。该方法包括:根据权重和输入激活计算剪枝指标;根据剪枝指标对大语言模型的线性层的每个输出进行局部权重的比较和修剪;使用低秩近似法对剪枝后的大语言模型进行微调以促进大语言模型性能的恢复。本发明能够有效地压缩LLMs,实现了较高的计算效率,在单个前向传播中执行,并且只有很小的内存开销,不仅避免了在局部分层重建过程中计算逆矩阵,而且保持了与幅值剪枝一样的简洁性。
-
公开(公告)号:CN110852090B
公开(公告)日:2024-03-19
申请号:CN201911080694.3
申请日:2019-11-07
Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
IPC: G06F40/284 , H04L41/147
Abstract: 本发明提供了一种用于舆情爬取的机构特征词汇扩展系统,包括:数据采集模块:用于采集数据;特征词清洗加工模块:用于对特征词进行初步筛选;特征词统计分析模块:用于通过相关度分析,进一步筛选特征词,最终生成拓展特征词。本发明另一方面提供了一种用于舆情爬取的机构特征词汇扩展方法,采用上述方案,筛选掉无用特征词并进行分析,生成拓展特征词,全面、快速采集相关舆情信息,一方面有效的避免了漏查情况的发生,另一方面也减少了无用特征词增加无用的数据,提高检索效率和质量,减少内存的占用。
-
公开(公告)号:CN116070266A
公开(公告)日:2023-05-05
申请号:CN202211731149.8
申请日:2022-12-30
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本申请提供了一种社交网络图结构匿名化处理方法及装置,属于数据安全技术领域。本申请通过,获取社交网络图结构对应的原始图数据,所述原始图数据中每个节点代表一个用户,任意两个节点间的连线所构成的边代表对应两个用户之间的关系;在所述原始图数据对应的所有的边中确定隐私边,并在所述原始图数据中删除所述隐私边得到预处理图;将所述预处理图输入至预先训练好的匿名图生成模型,以使所述匿名图生成模型输出对应的匿名图;其中,所述匿名图生成模型利用图嵌入技术提取所述预处理图的图嵌入特征,并基于所述图嵌入特征输出对应的匿名图。由此可以有效抵御攻击者结合图嵌入技术进行的推断攻击,提高匿名处理的安全性。
-
-
-
-
-
-
-
-
-