-
公开(公告)号:CN119940360A
公开(公告)日:2025-05-06
申请号:CN202510203852.9
申请日:2025-02-24
Applicant: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司
IPC: G06F40/284 , G06F40/216 , G06F40/166 , G06F16/35 , G06N3/045 , G06N3/08
Abstract: 本发明提供了一种基于大语言模型的企业文本数据多维处理方法和电子设备,包括:获取待处理文本数据中的关键词和对应的权重,并将获取的关键词按照权重由大到小的顺序进行重排序,得到排序后的关键词;为排序后的关键词赋予新权重,作为该关键词的最终权重;基于每个关键词对应的最终权重,从待处理文本数据中获取对应的上下文内容,作为对应的文本片段;利用多个文本分类模型对每个文本片段的类别标签进行预测,类别标签包括表征文本数据为正常文本数据的第一标签和表征文本数据为异常文本数据的第二标签。本发明基于关键词抽取和重排序进行数据处理,融合多种方式进行多维度分类,能够提高异常文本数据识别的准确率和增强泛化能力和鲁棒性。
-
公开(公告)号:CN115271324A
公开(公告)日:2022-11-01
申请号:CN202210649136.X
申请日:2022-06-09
Applicant: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司
IPC: G06Q10/06
Abstract: 本公开实施例提供一种集团风险监测预警方法、装置、设备和存储介质。集团风险预警方法,包括:确定集团包含的企业,以及集团内企业之间的关联关系;根据所述关联关系,基于所述集团内问题企业的第一风险指数进行风险传导,确定所述集团内企业的第二风险指数;基于所述集团内企业的第二风险指数,确定是否触发对所述集团的风险预警。采用本公开实施例提供的方案能够实现自动的集团风险预警,提高了风险预警的实时性。
-
公开(公告)号:CN113505221A
公开(公告)日:2021-10-15
申请号:CN202010214386.1
申请日:2020-03-24
Applicant: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司 , 北京中科闻歌智安科技有限公司
Abstract: 本发明公开了一种企业虚假宣传风险识别方法、设备和存储介质。该方法包括:在目标企业对应的多个企业舆情文本中,提取疑似风险文本;在每个疑似风险文本中提取对应种类的风险特征,形成每个疑似风险文本对应的风险特征向量;将多个疑似风险文本分别对应的风险特征向量顺次输入预先训练的风险识别模型,使风险识别模型对每个疑似风险文本进行识别,并将识别为存在虚假宣传风险的疑似风险文本确定为风险文本;根据确定出的所有风险文本的信息,确定目标企业对应的虚假宣传风险强度值;如果虚假宣传风险强度值大于预设的风险阈值,则确定目标企业存在虚假宣传风险。本发明可以避免人工匹配规则的局限性,提升了虚假宣传风险识别的准确性。
-
公开(公告)号:CN113505221B
公开(公告)日:2024-03-12
申请号:CN202010214386.1
申请日:2020-03-24
Applicant: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司 , 国科智安(北京)科技有限公司
IPC: G06F16/35 , G06F18/2411 , G06Q30/018
Abstract: 本发明公开了一种企业虚假宣传风险识别方法、设备和存储介质。该方法包括:在目标企业对应的多个企业舆情文本中,提取疑似风险文本;在每个疑似风险文本中提取对应种类的风险特征,形成每个疑似风险文本对应的风险特征向量;将多个疑似风险文本分别对应的风险特征向量顺次输入预先训练的风险识别模型,使风险识别模型对每个疑似风险文本进行识别,并将识别为存在虚假宣传风险的疑似风险文本确定为风险文本;根据确定出的所有风险文本的信息,确定目标企业对应的虚假宣传风险强度值;如果虚假宣传风险强度值大于预设的风险阈值,则确定目标企业存在虚假宣传风险。本发明可以避免人工匹配规则的局限性,提升了虚假宣传风险识别的准确性。
-
公开(公告)号:CN110119882A
公开(公告)日:2019-08-13
申请号:CN201910296002.2
申请日:2019-04-12
Applicant: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司
Abstract: 本申请涉及一种平台风险监控方法、装置、设备及存储介质,该方法包括:获取与业务数据对应的风险指数评估模型;从所述业务数据中获取风险点类别信息;利用所述风险指数评估模型,对所述风险点类别信息进行风险评估,得到所述风险点类别信息的风险指数评估结果。该方法可以缓解单靠人力对每个融资平台的风险进行有效监控的难度,达到了提高平台风险监控效率的技术效果。
-
公开(公告)号:CN118734928A
公开(公告)日:2024-10-01
申请号:CN202410629625.8
申请日:2024-05-21
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本公开涉及一种微调指令的构造方法、装置、设备及介质,该方法包括:将负面文本样本的标签划分为多个级别的目标分类标签;基于目标分类标签,使用预设的大模型对负面文本样本构造初始微调指令数据;在检查待微调的目标模型无法遵循初始微调指令数据的情况下,将初始微调指令数据修改为目标微调指令数据。本公开针对从知识库或网络上中搜索到负面文本样本,先划分目标分类标签,在基于此构造初始微调指令数据,其中,对于模型不能理解指令的问题,本实施例可以检查目标模型是否能遵循初始微调指令数据,并在无法遵循的情况下,将初始微调指令数据修改为目标微调指令数据,由此得到的目标微调指令能够使文本分类任务更好的拟合预训练目标模型的知识,提高了微调指令的可用性。
-
公开(公告)号:CN110852090B
公开(公告)日:2024-03-19
申请号:CN201911080694.3
申请日:2019-11-07
Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
IPC: G06F40/284 , H04L41/147
Abstract: 本发明提供了一种用于舆情爬取的机构特征词汇扩展系统,包括:数据采集模块:用于采集数据;特征词清洗加工模块:用于对特征词进行初步筛选;特征词统计分析模块:用于通过相关度分析,进一步筛选特征词,最终生成拓展特征词。本发明另一方面提供了一种用于舆情爬取的机构特征词汇扩展方法,采用上述方案,筛选掉无用特征词并进行分析,生成拓展特征词,全面、快速采集相关舆情信息,一方面有效的避免了漏查情况的发生,另一方面也减少了无用特征词增加无用的数据,提高检索效率和质量,减少内存的占用。
-
公开(公告)号:CN113378090B
公开(公告)日:2022-09-06
申请号:CN202110445408.X
申请日:2021-04-23
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/958 , G06F16/35 , G06F40/284 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种互联网网站相似度分析方法、装置以及可读存储介质,方法包括:从多个未分类的互联网网站中提取文本特征词;将各个未分类的互联网网站的文本特征词分别输入预先获取到的孪生网络编码工具,得到各个未分类的互联网网站的文本向量序列,其中:所述孪生网络编码工具是从训练好的孪生网络中的输入层至权值共享循环神经网络层进行迁移得到,且所述孪生网络的训练是基于从多个已分类的互联网网站中提取的文本特征词实现;将各个未分类的互联网网站的文本向量序列组成的矩阵进行降维处理得到低维弱相关矩阵;对低维弱相关矩阵进行聚类分析,根据聚类分析结果获取所述多个未分类的互联网网站的相似度情况,从而实现互联网网站相似度分析。
-
公开(公告)号:CN106850695B
公开(公告)日:2021-01-05
申请号:CN201710223922.2
申请日:2017-04-07
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明提出了一种云计算环境下异地异构虚拟化管理方法、装置及系统,该方法包括:步骤一,根据云计算管理平台中资源对象的管理特征,将所有资源对象划分为一个或多个管理域;步骤二,获取每个所述管理域管理所述资源对象的能力描述信息;步骤三,通过任一管理域与其他管理域的握手,获取所有管理域的能力描述信息;步骤四,将云计算任务分解为多个子任务,根据预置的子任务与能力描述信息的映射关系,将所述子任务分别发送至所述子任务对应的能力描述信息匹配的管理域。本发明所述一种云计算环境下异地异构虚拟化管理方法、装置及系统,通过管理域统一管理域内的资源,发挥不同类型数据中心,各个管理域的各自优势。
-
公开(公告)号:CN111914542A
公开(公告)日:2020-11-10
申请号:CN202010437168.4
申请日:2020-05-21
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
IPC: G06F40/279 , G06F40/216 , G06Q40/02 , G06Q50/26
Abstract: 本申请实施例提供了疑似非法集资市场主体识别方法、装置、终端及存储介质,涉及金融安全领域。本申请通过从互联网公开数据中获取与市场主体相关联的文本数据;通过预先训练的数据识别模型,从文本数据中识别出非法集资线索数据;将非法集资线索数据输入到预先训练的市场主体抽取模型中,得到疑似非法集资市场主体。本方案可以从互联网公开数据中自动识别出疑似非法集资行为的线索信息,定位疑似非法集资市场主体,从而提高识别非法集资市场主体的效率。
-
-
-
-
-
-
-
-
-