-
公开(公告)号:CN113608946A
公开(公告)日:2021-11-05
申请号:CN202110910834.6
申请日:2021-08-10
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 基于特征工程和表示学习的机器行为识别方法,由三个步骤构成:步骤一,对大数据进行分析,通过时间、频次等多维度的信息,建立3σ模型,用于确定机器行为的访问时间频段,在机器行为的访问时间频段下,通过分组聚合等方式,归纳总结提取出基于机器行为的特征;步骤二,并通过查阅API文档、软件模拟复现、官方的RFC文档等方式对行为进行定义和命名,整合成一组完备的机器行为特征,完成基于特征工程机器行为识别工作;步骤三,对识别效果不佳的模型加入与其他行为存在交集的特征,去排除其他行为,以提高准确率。
-
公开(公告)号:CN109902202B
公开(公告)日:2021-06-22
申请号:CN201910015462.3
申请日:2019-01-08
Applicant: 国家计算机网络与信息安全管理中心 , 北京航空航天大学
Abstract: 本发明提供一种视频分类方法及装置,用以解决相关技术中基于显著性引导的分类模型的分类性能较低的问题。该方法包括:提取待分类视频的关键帧;将所述关键帧输入预先根据训练集训练得到的双路神经网络模型,得到所述视频的分类结果以及所述视频的显著图,所述训练集中包括按照视频类型进行分类的视频以及视频显著图,所述双路神经网络模型包括一路用于对所述视频进行分类的第一子神经网络以及一路用于确定所述视频的显著图的第二子神经网络;将得到的所述显著图中置信度高于第一阈值的显著图加入所述训练集;使用所述训练集中的视频显著图重新训练所述第二子神经网络,得到更新后的双路神经网络模型。本发明有效提高了视频分类的性能。
-
公开(公告)号:CN110120230B
公开(公告)日:2021-06-01
申请号:CN201910015466.1
申请日:2019-01-08
Applicant: 国家计算机网络与信息安全管理中心 , 哈尔滨工业大学
Abstract: 本发明提供一种声学事件检测方法及装置,用以解决相关技术中声学事件检测精度较低的问题。该方法包括:提取待检测的音频的目标特征,得到第一特征数据;将所述第一特征数据分别输入第一GMM模型以及第二GMM模型,得到第一似然概率以及第二似然概率,所述第一GMM模型基于声学事件的音频的特征数据进行训练得到,所述第二GMM模型基于非声学事件的音频的特征数据进行训练得到;根据所述第一似然概率以及所述第二似然概率依次确定所述待检测的音频中各单位音频的类型,所述类型包括声学事件以及非声学事件;将确定出的相邻的类型为声学事件的单位音频合并;当合并后的音频持续的时长超过阈值时,确定发生声学事件。本发明有效提高了声学事件检测的精度。
-
公开(公告)号:CN108305616B
公开(公告)日:2021-03-16
申请号:CN201810039421.3
申请日:2018-01-16
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院声学研究所
Abstract: 本发明涉及一种基于长短时特征提取的音频场景识别方法及装置,该方法包括,对输入待识别音频信号进行预处理;对经过预处理后的所述待识别音频信号,进行短时音频特征提取,再进行长时音频特征提取,将所述待识别音频信号的所述长、短时音频特征联合,输入分类模型及其融合模型,进行分类和识别,输出音频场景的识别标签。本发明在常规短时特征提取的基础之上,进一步联合音频场景长时特征,可以表征复杂的音频场景信息,输入分类模型及其融合模型,进行分类和识别,输出音频场景的识别标签,其鲁棒性更强、区分性更好,且能够在更大程度上表征场景数据的整体特性,识别效率高、稳定性强。
-
公开(公告)号:CN108647214B
公开(公告)日:2020-06-30
申请号:CN201810270468.0
申请日:2018-03-29
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F40/58 , G06F40/289 , G06N3/04
Abstract: 本发明涉及语言处理领域,提出了一种基于深层神经网络翻译模型的解码方法,旨在解决机器翻译模型中模型训练复杂度高、训练难度大解码速度慢等问题。该方法的具体实施方式包括:对待翻译语句进行分词处理,得到源语言词汇;步骤2,使用自动对齐工具对预设的翻译模型词汇表中的语料进行词对齐,得到与所述源语言词汇对齐的目标语言单词;步骤3,基于步骤2所得到的目标语言单词,确定出所述待翻译语句的目标端动态词汇表,根据预先构建的翻译模型,使用柱搜索方法解码出的语句作为所述翻译模型的输出;其中,所述翻译模型为基于门限残差机制和平行注意力机制的深层神经网络。本发明提升了模型翻译质量,提高了模型解码速度。
-
公开(公告)号:CN110610230A
公开(公告)日:2019-12-24
申请号:CN201910698120.6
申请日:2019-07-31
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种台标检测方法、装置及可读存储介质,该方法包括如下步骤:获取台标数据集,并对所述台标数据集进行分组获得台标训练集;构建多损失融合的孪生神经网络,并基于所述台标训练集对所构建的多损失融合的孪生神经网络进行训练获得训练后的多损失融合的孪生神经网络;通过所述训练后的多损失融合的孪生神经网络对待测台标进行检测。本发明方法通过构建孪生神经网络框架,很好地消除了样本数量不足对训练网络带来的影响,可以更好地检测未知的新的种类的敏感台标。
-
公开(公告)号:CN118051623A
公开(公告)日:2024-05-17
申请号:CN202410028993.7
申请日:2024-01-08
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/36 , G06F16/35 , G06N5/025 , G06N5/04 , G06F40/295 , G06F40/30 , G06F40/289 , G06F16/951 , G06F16/9535 , G06F16/9538 , H04L67/55
Abstract: 本发明涉及人工智能和知识工程技术领域,本发明提供了一种移动应用知识库构建系统和方法,能够实现面向移动应用知识库的构建,完成移动应用知识库的智能应用。本发明移动应用知识库构建系统,基于APP(应用)基础信息和内容数据的多源异构数据,通过应用实体抽取、属性抽取、关系抽取等结构化处理,结合移动APP推理规则和移动APP标签图谱实现,为移动APP相似性、关联性分析以及移动应用内容分析、风险研判等建立基于检索式的知识服务方式,提供了一种面向移动应用的知识库,是一套面向业务应用的知识属性体系,提高相关的工作和生产效率。
-
公开(公告)号:CN113608946B
公开(公告)日:2023-09-12
申请号:CN202110910834.6
申请日:2021-08-10
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 基于特征工程和表示学习的机器行为识别方法,由三个步骤构成:步骤一,对大数据进行分析,通过时间、频次等多维度的信息,建立3σ模型,用于确定机器行为的访问时间频段,在机器行为的访问时间频段下,通过分组聚合等方式,归纳总结提取出基于机器行为的特征;步骤二,并通过查阅API文档、软件模拟复现、官方的RFC文档等方式对行为进行定义和命名,整合成一组完备的机器行为特征,完成基于特征工程机器行为识别工作;步骤三,对识别效果不佳的模型加入与其他行为存在交集的特征,去排除其他行为,以提高准确率。
-
公开(公告)号:CN116680419A
公开(公告)日:2023-09-01
申请号:CN202310955604.0
申请日:2023-08-01
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/36 , G06F40/216 , G06F40/30 , G06F40/295
Abstract: 本发明涉及自然语言处理技术领域,提供一种多源数据映射关联细粒度不良信息检测方法,所述方法包括:获取待检测文本和历史浏览文本,待检测文本和历史浏览文本属于同一用户的浏览文本;对待检测文本进行实体关系抽取,得到待检测三元组;获取历史浏览文本中的不良信息所对应的历史三元组,并基于历史三元组与待检测三元组之间的关联度,从待检测三元组中确定出待检测文本中的不良信息所对应的三元组。本发明提供的一种多源数据映射关联细粒度不良信息检测方法,能够准确从待检测三元组中确定出待检测文本中的不良信息所对应的三元组,避免传统方法中分词演变绕过黑名单机制导致漏检的问题,进一步提高的不良信息的检测精度。
-
公开(公告)号:CN115982111A
公开(公告)日:2023-04-18
申请号:CN202211660716.5
申请日:2022-12-22
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/17 , G06F16/18 , H04L61/4511 , H04L101/69 , H04L101/668
Abstract: 本发明公开了一种基于IP访问特征的用户群体画像方法,涉及网络治理技术领域,该方法首先根据日志的访问域名的类别信息,通过数理统计的方法构建IP访问特征数据集,然后,基于用户群体划分算法识别特定群体和非特定群体,最后,构建用户群体属性标签体系,对划分的群体进行群体画像分析,在充分研究原始日志的基础上,以IP访问特征为着力点,设计了基于规则和机器学习相结合的用户群体划分算法,根据日志数据量大的特点,研究了在大数据情况下,优化机器学习算法效率的方法。
-
-
-
-
-
-
-
-
-