-
公开(公告)号:CN116578942B
公开(公告)日:2023-12-22
申请号:CN202310853781.8
申请日:2023-07-12
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/2433 , G06F17/18 , G06F18/214 , G06Q10/10
Abstract: 本申请实施例涉及一种榜单异常的处理方法及装置,所述方法包括:获取目标榜单信息,并按照设定的检测方法对目标榜单信息进行异常检测,得到对应的异常检测结果;将异常检测结果对应的异常样本信息输入到预先训练好的预估模型中进行评估处理,输出异常样本信息对应的在榜时长;根据在榜时长确定反馈调节策略;基于反馈调节策略执行对异常在榜信息的处理。通过创建榜单异常的检测工具,检测出每个榜单信息中存在的异常样本信息,通过设定的反馈调节策略对异常样本信息进行处理,达到治理异常榜单信息的目的;由此,可以实现利用机器审核结合人工审核,形成一套实时报警、反馈、调节的热榜治理机制,维护热榜的公平和稳定的技术效果。
-
公开(公告)号:CN116795980A
公开(公告)日:2023-09-22
申请号:CN202310440756.7
申请日:2023-04-21
Applicant: 国家计算机网络与信息安全管理中心 , 讯飞智元信息科技有限公司
IPC: G06F16/35 , G06F40/289 , G06F40/30 , G06N3/0455 , G06N3/047 , G06N3/048 , G06N3/0985
Abstract: 本发明公开了一种融合细粒度要素知识的短文本分类方法,该方法包括:通过梳理标注短文本数据完成数据标注,其中,所述数据标注为标注全量标注数据类别和数据中存在要素信息;针对标注后的短文本数据,采用关键要素提取文本分类联合训练算法,借助BERT+CRF提取短文本数据中的要素信息;进而融合细粒度信息,结合标签编码器Label Encoder来学习各个标签label的表示,得到一个符合实际的标签分布。本发明针对上述问题提出一种融合细粒度要素知识的短文本分类的解决方法,从而提升短文本分类的效果,进而促使更为精准分析短文本数据,自动找到有关垃圾信息,提高工作效率。
-
公开(公告)号:CN116561512A
公开(公告)日:2023-08-08
申请号:CN202310431305.7
申请日:2023-04-20
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/10 , G06F18/27 , G06F18/22 , G06F18/214 , G06F16/9035 , G06F16/951 , G06F16/9537 , G06F16/9538 , G06F16/9535 , G06F16/9038
Abstract: 本发明提出了一种基于COX回归的多平台虚假信息识别方法及装置,方法包括:获取各自表征一主题的多组数据信息;基于数据信息与预先标记的数据信息的比对情况进行筛选;对当前数据信息进行排序以及填充处理;基于COX回归算法,利用当前数据信息,构建COX回归识别模型,并确认每一主题对应的数据信息中,各个维度信息对数据信息危险程度的影响情况;利用当前构建的COX回归识别模型,对再次获取的表征一主题的数据信息进行识别处理。本发明可基于同一主题的虚假信息识别,并且可以根据影响主题信息的多种因素,在不同的周期内,识别不同维度数据的影响因素权重。
-
公开(公告)号:CN116383716A
公开(公告)日:2023-07-04
申请号:CN202310269511.2
申请日:2023-03-20
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: G06F18/241 , G06F18/213 , H04L9/40 , G06N3/0464 , G06N3/08
Abstract: 本发明涉及一种增加自注意力机制和加性角度最大化间隔层的加密流量网络行为识别方法和系统。该方法包括:对加密应用网络行为产生的流量进行预处理和嵌入表示;利用自注意力机制增强流量的嵌入表示的语义;构建加密应用行为流量识别模型,基于自注意力机制得到的结果,利用该模型提取流量的深度特征;在加密应用行为流量识别模型中设置加性角度最大化间隔层,用以最大化不同类别流量特征之间的间隔,增加不同类别向量之间的区分性;通过加密应用行为流量识别模型进行加密流量网络行为的识别。本发明能够解决现有技术在识别加密流量网络行为时未能有效表示流量特征并最大化不同网络行为产生流量特征向量之间的距离,从而导致误分率高的问题。
-
公开(公告)号:CN115080871A
公开(公告)日:2022-09-20
申请号:CN202210847062.0
申请日:2022-07-07
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9536 , G06F16/901 , G06N3/04 , G06N3/08 , G06Q50/00
Abstract: 本发明公开了一种跨社交网络社交用户对齐方法,涉及社交网络的用户关系挖掘领域。本发明为了解决现有社交用户对齐方法不能跨社交网络、计算精度低、对齐效率低的缺陷,采用如下步骤实现:采集社交网络的用户属性信息,构建用户关系拓扑图;根据边权重和节点的出入度计算节点权重;构建一阶近邻关系模型和二阶近邻关系模型,确定一阶邻居节点和二阶邻居节点,得到用户节点之间的相互关系;构建社交对齐神经网络,通过社交对齐神经网络对用户关系拓扑图中各节点进行邻居节点的信息聚合、拼接与非线性变换,得到跨社交网络的社交用户身份对齐结果。本发明主要用于通过跨社交网络对其社交用户实现用户关系挖掘。
-
公开(公告)号:CN114943073A
公开(公告)日:2022-08-26
申请号:CN202210380497.9
申请日:2022-04-12
Applicant: 国家计算机网络与信息安全管理中心 , 北京赋乐科技有限公司
Abstract: 本公开的实施例提供了加密流量的通用对称加密协议脱壳方法、装置、设备和计算机可读存储介质。所述方法包括获取加密协议的流量;基于预设的密码字典,通过马尔科夫‑GEP模型生成新的密码字典;基于加密协议密码字符组合规律,对所述新的密码字典中的密码进行规约;基于规约后的新的密码字典和传统的解密脱壳方法,构建对称加密协议脱壳模型;将所述加密协议的流量,输入至所述对称加密协议脱壳模型,完成脱壳。提高了脱壳准确度,使得脱壳更加高效。
-
公开(公告)号:CN114817661A
公开(公告)日:2022-07-29
申请号:CN202210448777.9
申请日:2022-04-26
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9035 , G06K9/62
Abstract: 本发明涉及一种基于IP地址画像的大规模IP自动分类方法,本方法首先基于各个IP画像的相似度关系构建图结构,由此确定核心的IP节点,对于新加入的节点,本方法对其进行分类的计算复杂度为O(n),n为核心节点的数量,因此适用于大规模IP数据的线上实时处理。同时,本方法在进行IP分类结果的更新时,会将之前的核心节点与新抽样的节点混合起来重新聚类,这一过程在一定程度上保证了各IP群体的核心稳定性,同时又能较好地反映它们的实时变化。本发明还涉及一种基于IP地址画像的大规模IP自动分类装置和存储介质。
-
公开(公告)号:CN119940368A
公开(公告)日:2025-05-06
申请号:CN202510008588.3
申请日:2025-01-03
Applicant: 国家计算机网络与信息安全管理中心 , 烟台中科网络技术研究所
IPC: G06F40/30 , G06F40/194 , G06F40/16 , G06N3/045 , G06N3/0475 , G06N3/042 , G06N3/0464 , G06F18/22 , G06F18/23211
Abstract: 本发明涉及文本数据分析技术领域,尤其涉及一种面向生成式大模型的文本同源性分析方法,包括以下步骤:S1:对面向生成式大模型的文本数据进行预处理后,将文本数据转化为高维语义嵌入向量,引入混合距离度量进行相似度分析;S2:采用基于密度峰值的动态聚类算法进行动态聚类分析,生成初步的同源文本簇,引入多重迭代映射与动态梯度扰动机制进一步分析,得到优化的同源文本簇;S3:将优化的同源文本簇进行多模态融合,利用图结构对融合后的多模态同源文本簇进行分析,应用时间序列分析方法,得到文本的同源性分析与来源追踪结果,本方法能够有效应对生成式大模型生成文本数据语义表达的多样性和复杂性,增强了文本表示的鲁棒性和准确性。
-
公开(公告)号:CN119759719A
公开(公告)日:2025-04-04
申请号:CN202411830029.2
申请日:2024-12-12
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F11/34 , G06N3/0475 , G06N3/0455 , G06N3/08 , G06N5/022 , G06N5/04
Abstract: 一种基于提示学习的大模型测评数据生成方法及系统,属于机器学习模型领域,包括以下步骤:从提示模板集合中获取初始提示模板;对初始提示模板进行变异操作;接收输入;将变异后的提示模板和接收的输入相结合组成若干完整提示,将这些完整提示输入到生成模型中得到测评数据;评估测评数据的生成质量,将能生成高质量测评数据的提示模板放入提示模板集合中,供下一次测评数据生成使用。与现有技术相比,本发明具有测评数据生成质量高、测评数据生成成本低、测评数据生成速度快、测评场景丰富、测评数据生成容易实现等优点。
-
公开(公告)号:CN119600625A
公开(公告)日:2025-03-11
申请号:CN202510143447.2
申请日:2025-02-10
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及自然语言处理技术领域,提供一种变体词识别方法及装置,所述方法包括:对待识别文本进行分词,得到至少一个文本分词;对各文本分词进行文本图像生成,得到各文本分词对应的分词图像;基于各文本分词的编码特征,以及对应分词图像的编码特征,得到各文本分词的变体词识别结果。本发明结合各文本分词的编码特征以及对应分词图像的编码特征,可以融合文本语义与视觉细节信息,将文本模态的文本分词和图像模态的分词图像对齐到同一语义空间,更全面地理解和识别变体词,有效提升了变体词识别的准确率。
-
-
-
-
-
-
-
-
-