告诉你几个将垃圾邮件拒之门外的妙招(2) | |
---|---|
http://www.sina.com.cn 2006年01月25日 18:15 中关村在线 | |
(3) 贝叶斯(Bayes)方法过滤 即使采用了前面的技术,仍然会有相当一部分垃圾邮件漏网。因为垃圾邮件的最直观和最核心的部分往往存在于邮件体当中。对此种情况,目前最有效、最根本的方法是基于邮件正文的内容过滤。其中比较简单的方法是,结合内容扫描引擎,根据垃圾邮件的常用语、垃圾邮件受益者的姓名、电话号码、Web地址等信息进行过滤。Foxmail提供了“贝叶斯过滤”功能,它是一种成熟的基于机器学习理论的方法。要想使用该功能,必须统计到足够多的垃圾邮件和非垃圾邮件的关键字,也就是说需要尽量多地学会识别垃圾邮件和非垃圾邮件才能且确定垃圾与非垃圾邮件的分类。图4至图6给出了使用贝叶斯方法过滤的步骤,通过对用户选定的收件箱中的邮件进行学习,该贝叶斯方法学习到了正常邮件的一些特点,所以能够识别异于正常邮件的“非法邮件”。特别需要提醒用户的是,在使用该方法过滤的时候,用户需要权衡到底选定收件箱、发件箱还是垃圾邮件箱进行学习,这直接影响到使用贝叶斯方法进行学习,从而影响到垃圾邮件过滤的效果。强烈建议用户对自己确认的垃圾邮件箱中的邮件进行“垃圾邮件”类型的学习,因为这样即算漏掉了部分垃圾邮件,也不会造成比较严重的后果;否则如果设置不当的话,该方法极有可能将用户的正常邮件过滤掉(比如说很久没有和自己联系的好友的信件,用户由于选择了对收件箱中的邮件进行正常邮件类别的学习,那么当该封邮件来到的时候,这封邮件极有可能被判为垃圾邮件而丢弃),引起不必要的损失。
在使用垃圾邮件客户端的过程中,用户需要特别注意:需要固定时间、固定周期地对其黑名单、白名单进行更新,并根据实际情况使用贝叶斯方法进行再学习,不断提升过滤效果。因为,垃圾邮件的种类和特征在一段时间之后是有可能发生改变的,所以需要动态地对垃圾邮件客户端进行配置。 将垃圾邮件有效地拒之门外是一个长期的过程,用户需要综合使用上述方法进行垃圾邮件防御工作,尽可能地避免垃圾邮件的骚扰。同时,用户也应该多从反垃圾邮件的过程中多吸取教训和总结经验,这样才能在这场长期的战斗中处于有利的地位,保护自己的权益。 |