-
公开(公告)号:CN106055633A
公开(公告)日:2016-10-26
申请号:CN201610367978.0
申请日:2016-05-30
Applicant: 国家计算机网络与信息安全管理中心
CPC classification number: G06F16/35 , G06K9/6256 , G06K9/6269
Abstract: 本发明提出了一种中文微博主客观句分类方法,所述方法包括:根据预设的主观句训练语料集和客观句训练语料集形成如下的六个特征集:3‑POS主观模式特征集、句法依存关系特征集、情感词特征集、情感影响因子特征集、语气词及标点符号特征集、字数及链接特征集;根据所述六个特征集,利用支持向量机SVM算法,形成中文微博主客观句分类模型,以利用所述中文微博主客观句分类模型对待测试语句进行主客观句分类。所述方法不但考虑了中文文本的语言学特点,同时也充分利用微博的个性化特征,使得本文所选取的特征更加接近微博本身的语义描述。
-
公开(公告)号:CN105975526A
公开(公告)日:2016-09-28
申请号:CN201610280958.X
申请日:2016-04-29
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
CPC classification number: G06F16/9566
Abstract: 本发明公开了一种URL链接有效性的验证方法。该方法包括:向待验证的URL链接发送网络请求,根据网络请求状态返回码判定网络请求是否访问成功;当访问失败时,直接判定URL链接失效;当访问成功时,调用浏览器,模拟用户访问过程,并根据浏览器的渲染结果判定URL链接是否有效。本发明将待验证的URL链接通过网络请求返回状态码对URL进行粗过滤,然后在根据浏览器的渲染结果对URL链接进行更为准确的判断。通过将两者相结合的方式,可提升整个验证过程的验证效率、减小系统开销,同时保证了验证结果的准确性。
-
公开(公告)号:CN105975392A
公开(公告)日:2016-09-28
申请号:CN201610282319.7
申请日:2016-04-29
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F11/36
CPC classification number: G06F11/3616
Abstract: 本发明公开了一种基于抽象语法树的重复代码检测方法及装置。该重复代码检测方法包括:对待检测代码和样本代码分别构建抽象语法树;将两棵抽象语法树的子树根据根节点类型分别进行分类;将根节点类型相同的两棵抽象语法树的子树进行对比,判断是否存在公共子树;当存在公共子树时,获取公共子树对应的代码,判定该代码即为重复代码。通过本发明的方法可以完全避免空格、换行、缩进、注释等无关信息对相似性判定的影响,快速检测出重复代码。
-
公开(公告)号:CN105893157A
公开(公告)日:2016-08-24
申请号:CN201610282320.X
申请日:2016-04-29
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种开放分布式系统资源管理与任务调度系统与方法,本发明通过将开放分布式系统资源管理与任务调度系统分为任务管理器、资源策略优化调度器、资源管理器、以及多个节点管理器,简化中央调度功能,解决了现有技术中的资源管理与调度系统较难直接应用在异构硬件资源环境下管理执行异构任务的问题,能够提供一种管理异构硬件资源并调度执行异构任务的框架,可支持硬件资源的动态变化与不同类型任务的调度管理。
-
公开(公告)号:CN114943073B
公开(公告)日:2024-09-10
申请号:CN202210380497.9
申请日:2022-04-12
Applicant: 国家计算机网络与信息安全管理中心 , 北京赋乐科技有限公司
IPC: G06F21/46 , G06F21/60 , G06F18/214 , G06F18/20 , G06N3/0442 , G06N3/0464 , G06N3/08 , G06N3/126 , G06N7/01
Abstract: 本公开的实施例提供了加密流量的通用对称加密协议脱壳方法、装置、设备和计算机可读存储介质。所述方法包括获取加密协议的流量;基于预设的密码字典,通过马尔科夫‑GEP模型生成新的密码字典;基于加密协议密码字符组合规律,对所述新的密码字典中的密码进行规约;基于规约后的新的密码字典和传统的解密脱壳方法,构建对称加密协议脱壳模型;将所述加密协议的流量,输入至所述对称加密协议脱壳模型,完成脱壳。提高了脱壳准确度,使得脱壳更加高效。
-
公开(公告)号:CN118349883A
公开(公告)日:2024-07-16
申请号:CN202410345245.1
申请日:2024-03-25
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/241 , G06F18/214 , G06N3/0455 , G06N3/0442 , G06N3/0464 , G06F21/60
Abstract: 本申请提供一种重要数据的识别方法、装置和电子设备,涉及数据处理技术领域和人工智能技术领域。该方法包括:在识别重要数据时,可以先获取待识别数据集,待识别数据集中包括多个数据和各数据的重要度指标;针对各数据,将数据和数据的重要度指标输入至预设的重要数据识别模型中,得到数据对应的重要度得分;再基于各数据对应的重要度得分,从多个数据中识别重要数据,这样基于重要数据识别模型识别重要数据,与现有技术中基于预设重要度规则识别重要数据相比,不仅可以有效地提高重要数据的识别效率,而且提高了识别结果的准确度。
-
公开(公告)号:CN117312864A
公开(公告)日:2023-12-29
申请号:CN202311618449.X
申请日:2023-11-30
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/214 , G06F18/10 , G06F18/25 , G06F40/284 , G06N3/08 , G06N3/0455 , G06N3/0475
Abstract: 本发明提供一种基于多模态信息的变形词生成模型的训练方法及装置,涉及语言生成技术领域,方法包括:获取变形词语料库,变形词语料库包括的不同初始样本由多模态信息组成;对变形词语料库中不同初始样本的不同类型的语料信息,采用对应类型的预处理方式分别进行预处理,生成大规模语料库;大规模语料库中每个语料样本包括多个语料信息的权重及特征向量,不同的语料信息的权重用于表征不同的语料信息在对应样本中不同的贡献程度;基于大规模语料库中预设数量的语料样本包括的多个语料信息的权重及特征向量,对初始模型进行训练,得到基于多模态信息的变形词生成模型。本发明能够提高变形词生成的精度和准确率。
-
公开(公告)号:CN116578942B
公开(公告)日:2023-12-22
申请号:CN202310853781.8
申请日:2023-07-12
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/2433 , G06F17/18 , G06F18/214 , G06Q10/10
Abstract: 本申请实施例涉及一种榜单异常的处理方法及装置,所述方法包括:获取目标榜单信息,并按照设定的检测方法对目标榜单信息进行异常检测,得到对应的异常检测结果;将异常检测结果对应的异常样本信息输入到预先训练好的预估模型中进行评估处理,输出异常样本信息对应的在榜时长;根据在榜时长确定反馈调节策略;基于反馈调节策略执行对异常在榜信息的处理。通过创建榜单异常的检测工具,检测出每个榜单信息中存在的异常样本信息,通过设定的反馈调节策略对异常样本信息进行处理,达到治理异常榜单信息的目的;由此,可以实现利用机器审核结合人工审核,形成一套实时报警、反馈、调节的热榜治理机制,维护热榜的公平和稳定的技术效果。
-
公开(公告)号:CN116795980A
公开(公告)日:2023-09-22
申请号:CN202310440756.7
申请日:2023-04-21
Applicant: 国家计算机网络与信息安全管理中心 , 讯飞智元信息科技有限公司
IPC: G06F16/35 , G06F40/289 , G06F40/30 , G06N3/0455 , G06N3/047 , G06N3/048 , G06N3/0985
Abstract: 本发明公开了一种融合细粒度要素知识的短文本分类方法,该方法包括:通过梳理标注短文本数据完成数据标注,其中,所述数据标注为标注全量标注数据类别和数据中存在要素信息;针对标注后的短文本数据,采用关键要素提取文本分类联合训练算法,借助BERT+CRF提取短文本数据中的要素信息;进而融合细粒度信息,结合标签编码器Label Encoder来学习各个标签label的表示,得到一个符合实际的标签分布。本发明针对上述问题提出一种融合细粒度要素知识的短文本分类的解决方法,从而提升短文本分类的效果,进而促使更为精准分析短文本数据,自动找到有关垃圾信息,提高工作效率。
-
公开(公告)号:CN116561512A
公开(公告)日:2023-08-08
申请号:CN202310431305.7
申请日:2023-04-20
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/10 , G06F18/27 , G06F18/22 , G06F18/214 , G06F16/9035 , G06F16/951 , G06F16/9537 , G06F16/9538 , G06F16/9535 , G06F16/9038
Abstract: 本发明提出了一种基于COX回归的多平台虚假信息识别方法及装置,方法包括:获取各自表征一主题的多组数据信息;基于数据信息与预先标记的数据信息的比对情况进行筛选;对当前数据信息进行排序以及填充处理;基于COX回归算法,利用当前数据信息,构建COX回归识别模型,并确认每一主题对应的数据信息中,各个维度信息对数据信息危险程度的影响情况;利用当前构建的COX回归识别模型,对再次获取的表征一主题的数据信息进行识别处理。本发明可基于同一主题的虚假信息识别,并且可以根据影响主题信息的多种因素,在不同的周期内,识别不同维度数据的影响因素权重。
-
-
-
-
-
-
-
-
-