-
公开(公告)号:CN108629183B
公开(公告)日:2021-07-20
申请号:CN201810453922.6
申请日:2018-05-14
Applicant: 南开大学
Abstract: 本发明提出一种基于可信度区间的多模型恶意代码检测系统。每种机器学习检测模型都对应着底层数据的一种分布,各种基于阈值的检测模型都可以整合到本发明的统计平台上,实现从多角度观检测意代码数据的分布,缓解概念漂移带来的模型退化问题。本检测系统改变了现有机器学习检测模型的0或1的预测模式,基于现有的检测模型计算出的得分,进行统计分析,对样本的得分分布和样本的标签建立保序回归函数。对于未知样本,根据现有检测模型给出的得分,输入已计算出的保护回归函数,可以给出预测为某个标签的可信度概率区间,这个概率区间可以缓解固定阈值对训练数据集的过度拟合问题,提升检测模型对当前动态数据的适应能力,提前发现概念漂移现象。
-
公开(公告)号:CN108629183A
公开(公告)日:2018-10-09
申请号:CN201810453922.6
申请日:2018-05-14
Applicant: 南开大学
Abstract: 本发明提出一种基于可信度区间的多模型恶意代码检测系统。每种机器学习检测模型都对应着底层数据的一种分布,各种基于阈值的检测模型都可以整合到本发明的统计平台上,实现从多角度观检测意代码数据的分布,缓解概念漂移带来的模型退化问题。本检测系统改变了现有机器学习检测模型的0或1的预测模式,基于现有的检测模型计算出的得分,进行统计分析,对样本的得分分布和样本的标签建立保序回归函数。对于未知样本,根据现有检测模型给出的得分,输入已计算出的保护回归函数,可以给出预测为某个标签的可信度概率区间,这个概率区间可以缓解固定阈值对训练数据集的过度拟合问题,提升检测模型对当前动态数据的适应能力,提前发现概念漂移现象。
-