-
公开(公告)号:CN100472484C
公开(公告)日:2009-03-25
申请号:CN200480003769.3
申请日:2004-02-25
Applicant: 微软公司
IPC: G06F13/00
CPC classification number: H04L51/12 , G06Q10/107
Abstract: 本发明提供了便于就在服务器和/或基于客户机的体系结构中防止垃圾邮件而对项目进行分类的反馈循环系统和方法。本发明利用机器学习方法,将其应用于垃圾邮件过滤器,尤其是随机地对传入的电子邮件消息进行采样,从而获得合法和垃圾/兜售信息邮件两者的例子来生成训练数据集。被标识为垃圾邮件战士的用户被要求对其传入电子邮件消息的选择分别是合法邮件还是垃圾邮件进行表决。数据库存储每个邮件和表决事务的属性,诸如用户信息、消息属性和内容摘要以及每个消息的轮询结果等,以生成用于机器学习系统的训练数据。该机器学习系统便于创建改进的垃圾邮件过滤器,它被训练成能识别合法邮件和垃圾邮件两者,并能区分这两者。
-
公开(公告)号:CN1809821A
公开(公告)日:2006-07-26
申请号:CN200480003769.3
申请日:2004-02-25
Applicant: 微软公司
IPC: G06F13/00
CPC classification number: H04L51/12 , G06Q10/107
Abstract: 本发明提供了便于就在服务器和/或基于客户机的体系结构中防止垃圾邮件而对项目进行分类的反馈循环系统和方法。本发明利用机器学习方法,将其应用于垃圾邮件过滤器,尤其是随机地对传入的电子邮件消息进行采样,从而获得合法和垃圾/兜售信息邮件两者的例子来生成训练数据集。被标识为垃圾邮件战士的用户被要求对其传入电子邮件消息的选择分别是合法邮件还是垃圾邮件进行表决。数据库存储每个邮件和表决事务的属性,诸如用户信息、消息属性和内容摘要以及每个消息的轮询结果等,以生成用于机器学习系统的训练数据。该机器学习系统便于创建改进的垃圾邮件过滤器,它被训练成能识别合法邮件和垃圾邮件两者,并能区分这两者。
-
公开(公告)号:CN1573784B
公开(公告)日:2012-11-07
申请号:CN200410063953.9
申请日:2004-06-04
Applicant: 微软公司
IPC: G06F17/60
CPC classification number: H04L51/12 , G06Q10/107
Abstract: 本发明包括一种易于从消息中提取用于垃圾邮件过滤的数据的系统和方法。所提取的数据可以是特征的形式,其能够与机器学习系统一同使用,以建立改进的过滤器。嵌入在消息体中的与源信息以及其它信息相关联的数据能够作为特征被提取,该消息允许消息的收件人联系和/或者响应消息的发件人。在被用作机器学习系统的特征之前,该特征或者其子集能够被规范化和/或者被摆脱困惑。该(已摆脱困惑的)特征能被用于填充多个易于检测和阻止垃圾邮件的特征列表。示范性的特征包括一个email地址,IP地址,URL,指向URL的一个嵌入式图像,以及/或者其中的一部分。
-
公开(公告)号:CN1573784A
公开(公告)日:2005-02-02
申请号:CN200410063953.9
申请日:2004-06-04
Applicant: 微软公司
IPC: G06F17/60
CPC classification number: H04L51/12 , G06Q10/107
Abstract: 本发明包括一种易于从消息中提取用于垃圾邮件过滤的数据的系统和方法。所提取的数据可以是特征的形式,其能够与机器学习系统一同使用,以建立改进的过滤器。嵌入在消息体中的与源信息以及其它信息相关联的数据能够作为特征被提取,该消息允许消息的收件人联系和/或者响应消息的发件人。在被用作机器学习系统的特征之前,该特征或者其子集能够被规范化和/或者被摆脱困惑。该(已摆脱困惑的)特征能被用于填充多个易于检测和阻止垃圾邮件的特征列表。示范性的特征包括一个email地址,IP地址,URL,指向URL的一个嵌入式图像,以及/或者其中的一部分。
-
-
-