-
公开(公告)号:CN105975526A
公开(公告)日:2016-09-28
申请号:CN201610280958.X
申请日:2016-04-29
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
CPC classification number: G06F16/9566
Abstract: 本发明公开了一种URL链接有效性的验证方法。该方法包括:向待验证的URL链接发送网络请求,根据网络请求状态返回码判定网络请求是否访问成功;当访问失败时,直接判定URL链接失效;当访问成功时,调用浏览器,模拟用户访问过程,并根据浏览器的渲染结果判定URL链接是否有效。本发明将待验证的URL链接通过网络请求返回状态码对URL进行粗过滤,然后在根据浏览器的渲染结果对URL链接进行更为准确的判断。通过将两者相结合的方式,可提升整个验证过程的验证效率、减小系统开销,同时保证了验证结果的准确性。
-
公开(公告)号:CN105975392A
公开(公告)日:2016-09-28
申请号:CN201610282319.7
申请日:2016-04-29
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F11/36
CPC classification number: G06F11/3616
Abstract: 本发明公开了一种基于抽象语法树的重复代码检测方法及装置。该重复代码检测方法包括:对待检测代码和样本代码分别构建抽象语法树;将两棵抽象语法树的子树根据根节点类型分别进行分类;将根节点类型相同的两棵抽象语法树的子树进行对比,判断是否存在公共子树;当存在公共子树时,获取公共子树对应的代码,判定该代码即为重复代码。通过本发明的方法可以完全避免空格、换行、缩进、注释等无关信息对相似性判定的影响,快速检测出重复代码。
-
公开(公告)号:CN105069169A
公开(公告)日:2015-11-18
申请号:CN201510547203.7
申请日:2015-08-31
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
Abstract: 本发明提出了一种网站镜像的检测方法及装置。所述检测方法包括:计算待检测网站的标题信息与原始网站的标题信息的相似度,若所述相似度超过设定阈值,则所述待检测网站为疑似网站;比对所述疑似网站的网页结构中的可视化元素和所述原始网站的网页结构中的可视化元素,若满足预设条件,则判定所述疑似网站为镜像网站,在保证检测准确性的同时,提高网站镜像检测的效率。
-
公开(公告)号:CN104361037A
公开(公告)日:2015-02-18
申请号:CN201410591807.7
申请日:2014-10-29
Applicant: 国家计算机网络与信息安全管理中心
CPC classification number: G06F17/30705 , G06F17/271
Abstract: 本发明公开了一种微博分类方法及装置。该方法包括:步骤1,对训练语料集合进行预处理,对预处理后的训练语料进行分词,获取候选特征,并对候选特征进行权重计算,根据权重计算结果进行特征选择,获取最终的分类特征;步骤2,根据最终的分类特征,采用贝叶斯分类器进行模型训练,获取分类模型;步骤3,采用贝叶斯分类器根据分类模型对微博文档进行分类。借助于本发明的技术方案,提高了分类的召回率与准确率。
-
公开(公告)号:CN117391072A
公开(公告)日:2024-01-12
申请号:CN202311173762.7
申请日:2023-09-12
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/279 , G06F40/216 , G06F16/35 , G06N3/0464 , G06N3/09
Abstract: 本发明提供了一种基于遮挡语言模型的文本纠错方法、系统、设备及介质,能够通过无监督学习大量语料文本的方式,完成对文本的智能纠错,不需要人工标记的大量语料。本发明在不需要准备专门的平行语料的情况下完成中文文本纠错的任务,只需要提供大量中文语言的文本给语言模型自动进行训练即可,采用无监督学习大量语言文本的方式拓展了平行语料范围有限造成的局限性,不需要人工标记的大量语料。本发明采用遮挡语言模型的方式进行文本纠错,其过程中通过无监督学习大量语料文本的方式,完成对文本的智能纠错,应用于针对中文文本纠错的系统中,发现并纠错文本中在输入等过程中产生的错误。
-
公开(公告)号:CN116702094A
公开(公告)日:2023-09-05
申请号:CN202310957274.9
申请日:2023-08-01
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/26 , G06F18/25 , G06F18/213 , G06F18/22 , G06F18/27 , G06N3/045 , G06N3/044 , G06N3/0442 , G06N3/0464 , G06N3/08
Abstract: 本发明涉及数据处理技术领域,提供一种群体应用偏好特征表示方法,其中方法包括:获取用户的交互数据;基于多模态预训练模型,提取所述交互数据的特征表示;基于所述交互数据的特征表示,确定所述交互数据的群体应用偏好特征;基于所述群体应用偏好特征,对所述用户进行画像。本发明提供的群体应用偏好特征表示方法,能够自适应的针对任意的纯文本数据、纯图像数据、图文混合数据提取联合特征,实现对多模态数据的分析处理,在图文模态下,可以增加特征提取的语义交互能力,使得到的群体应用偏好特征更准确,从而提高用户画像的质量。
-
公开(公告)号:CN109241438B
公开(公告)日:2022-06-24
申请号:CN201811128658.5
申请日:2018-09-27
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9535 , G06F40/30 , G06F40/284
Abstract: 本发明公开了一种基于要素的跨通道热点事件发现方法、装置及存储介质,本发明融合某一领域的新闻报道数据与微博数据,通过联合两个通道提取的要素与文本语义相似度分析,有利于发现该领域热点事件,并且更全面细致的了解热点事件。
-
公开(公告)号:CN110889115A
公开(公告)日:2020-03-17
申请号:CN201911081426.3
申请日:2019-11-07
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F21/56
Abstract: 本发明公开了一种恶意推送行为检测方法及装置,所述方法包括:对应用程序进行过滤,筛选出带有系统通知栏推送的应用程序;对筛选出的应用程序分别进行动态分析和静态分析,获取动态分析结果和静态分析结果;对所述动态分析结果和所述静态分析结果进行研判,确定具有恶意推送行为的应用程序。
-
公开(公告)号:CN104601573B
公开(公告)日:2018-04-06
申请号:CN201510020365.5
申请日:2015-01-15
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04L29/06
Abstract: 本发明提出了一种Android平台URL访问结果验证方法及装置,面对背景技术中提到的安全威胁,可以快速、有效地获取URL访问过程信息,包括对URL链接的访问是否成功,判断Android浏览器应用是否具有网络代理能力等,也对能够成功访问的URL进行周期性测试。本发明通过图片对比、网络数据包分析来判断链接是否可用,提供必要的相应格式的分析报告供人工分析验证。可以广泛应用在Android应用程序信息安全自动化批量检测工具之中。
-
公开(公告)号:CN104361037B
公开(公告)日:2017-12-19
申请号:CN201410591807.7
申请日:2014-10-29
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种微博分类方法及装置。该方法包括:步骤1,对训练语料集合进行预处理,对预处理后的训练语料进行分词,获取候选特征,并对候选特征进行权重计算,根据权重计算结果进行特征选择,获取最终的分类特征;步骤2,根据最终的分类特征,采用贝叶斯分类器进行模型训练,获取分类模型;步骤3,采用贝叶斯分类器根据分类模型对微博文档进行分类。借助于本发明的技术方案,提高了分类的召回率与准确率。
-
-
-
-
-
-
-
-
-