用于恶意URL检测的在线主动机器学习方法

    公开(公告)号:CN110766165B

    公开(公告)日:2023-08-08

    申请号:CN201911010913.0

    申请日:2019-10-23

    Applicant: 扬州大学

    Inventor: 王子涵 翟婷婷

    Abstract: 本发明公开了机器学习和网络信息安全技术领域内的一种用于恶意URL检测的在线主动机器学习方法,包括以下步骤:步骤1)当互联网用户要访问一个URL时,利用自动特征提取器,对该URL进行特征提取,构成该URL的特征向量;步骤2)使用分类器对特征向量进行在线预测,判断是否为恶意;步骤3)在线预测结束后,进入标记决策阶段,判断是否对当前的URL进行标记,得到决策变量;步骤4)获得完整的URL数据信息后,利用在线模型更新程序修正当前的分类器,得到最新的分类器;步骤5)回到步骤1),等待用户浏览器发出新一轮URL请求,本发明在同等的标记选择比率下,能取得更高的在线检测准确率。

    用于恶意URL检测的在线主动机器学习方法

    公开(公告)号:CN110766165A

    公开(公告)日:2020-02-07

    申请号:CN201911010913.0

    申请日:2019-10-23

    Applicant: 扬州大学

    Inventor: 王子涵 翟婷婷

    Abstract: 本发明公开了机器学习和网络信息安全技术领域内的一种用于恶意URL检测的在线主动机器学习方法,包括以下步骤:步骤1)当互联网用户要访问一个URL时,利用自动特征提取器,对该URL进行特征提取,构成该URL的特征向量;步骤2)使用分类器对特征向量进行在线预测,判断是否为恶意;步骤3)在线预测结束后,进入标记决策阶段,判断是否对当前的URL进行标记,得到决策变量;步骤4)获得完整的URL数据信息后,利用在线模型更新程序修正当前的分类器,得到最新的分类器;步骤5)回到步骤1),等待用户浏览器发出新一轮URL请求,本发明在同等的标记选择比率下,能取得更高的在线检测准确率。

    一种用于图像多标签数据流分类的在线自适应核选择方法

    公开(公告)号:CN119273942A

    公开(公告)日:2025-01-07

    申请号:CN202411340642.6

    申请日:2024-09-25

    Applicant: 扬州大学

    Inventor: 翟婷婷 方楠楠

    Abstract: 本发明公开了机器学习技术领域内的一种用于图像多标签数据流分类的在线自适应核选择方法,包括以下步骤:程序接收到一个待识别图像的特征向量;利用特征映射子程序将特征向量分别映射到特征空间,得到映射后的特征向量;使用当前最新的多标签核分类器来实时预测特征向量的相关标签集;预测结束后,进入多标签核分类器的在线更新子程序,该子程序得到多标签核分类器的迭代更新公式,从而得到下一轮的多标签核分类器;等待下一轮图像特征向量;若没有新的特征向量传入,则退出程序,本发明能在在线学习的过程中执行核函数的选择,同时进行多标签核分类器的在线学习,极大提高已有的在线核方法的在线多标签预测性能。

    用于文本多标签分类任务的基于间隔分布的在线机器学习方法

    公开(公告)号:CN115081448A

    公开(公告)日:2022-09-20

    申请号:CN202210877759.2

    申请日:2022-07-25

    Applicant: 扬州大学

    Inventor: 翟婷婷 胡坤永

    Abstract: 本发明公开了机器学习领域内的一种基于间隔分布的在线机器学习方法,包括以下步骤:1)在第t轮,接收到本轮文档的特征向量2)进入多标签预测程序;3)预测结束后,接收到xt的真实相关标签集进入多标签分类器在线更新程序,更新当前的多标签分类器Wt,得到下一轮的多标签分类器Wt+1;4)回到步骤(1),等待接收第t+1轮的文本特征向量;若没有新的文本特征向量传入,则退出程序,本发明考虑了间隔分布,泛化性能更加优异,因此在多个多标签性能评价指标上的结果更好。

    一种用于文本多分类任务的在线主动机器学习方法

    公开(公告)号:CN111949794B

    公开(公告)日:2024-06-28

    申请号:CN202010817161.5

    申请日:2020-08-14

    Applicant: 扬州大学

    Inventor: 翟婷婷 龚楷伦

    Abstract: 本发明公开了一种用于文本多分类任务的在线主动机器学习方法,包括以下步骤:1)在第t轮,接收到本轮的文档经特征提取后得到的特征向量xt;2)使用最新的多分类器Wt对xt进行预测,得到多分类预测结果#imgabs0#3)在线预测结束后,进入采样决策程序:判断是否获取xt的真实类标签yt;记Zt为采样决策变量,如果Zt=1,则获取yt,得到完整的数据信息(xt,yt);如果Zt=0,则不获取yt,也不更新当前的多分类器,直接进入步骤5);4)得到完整的数据信息(xt,yt)后,进入在线更新程序,更新当前的多分类器Wt,得到下一轮的多分类器Wt+1;5)回到步骤1),进行第t+1轮的文本特征向量的提取;本发明在同等的类标签采样比例下,能取得更高的在线多分类准确率。

    一种用于文本多分类任务的在线主动机器学习方法

    公开(公告)号:CN111949794A

    公开(公告)日:2020-11-17

    申请号:CN202010817161.5

    申请日:2020-08-14

    Applicant: 扬州大学

    Inventor: 翟婷婷 龚楷伦

    Abstract: 本发明公开了一种用于文本多分类任务的在线主动机器学习方法,包括以下步骤:1)在第t轮,接收到本轮的文档经特征提取后得到的特征向量xt;2)使用最新的多分类器Wt对xt进行预测,得到多分类预测结果3)在线预测结束后,进入采样决策程序:判断是否获取xt的真实类标签yt;记Zt为采样决策变量,如果Zt=1,则获取yt,得到完整的数据信息(xt,yt);如果Zt=0,则不获取yt,也不更新当前的多分类器,直接进入步骤5);4)得到完整的数据信息(xt,yt)后,进入在线更新程序,更新当前的多分类器Wt,得到下一轮的多分类器Wt+1;5)回到步骤1),进行第t+1轮的文本特征向量的提取;本发明在同等的类标签采样比例下,能取得更高的在线多分类准确率。

Patent Agency Ranking