电子邮件垃圾安全过滤程序设计 第4页
4 52 45 86.54% 7 13.46% 0 0
5 56 49 87.50% 7 12.50% 0 0
6 60 49 81.67% 11 18.33% 0 0
7 64 53 82.81% 11 17.19% 0 0
8 68 55 80.88% 13 19.12% 0 0
9 72 59 81.94% 13 18.06% 0 0
10 76 58 76.31% 18 23.69% 0 0
11 80 61 76.25% 19 23.75% 0 0
表1 性能测试表
结论:利用Rough集理论对垃圾邮件分析、过滤实践证明是可行的,效果较好,而且具有处理速度快,人——机交互简单的优点。
第五章 现有方案讨论及下一步的工作
5.1影响系统性能的因素
经过电子邮件理论分析以后得出的11个决策表的条件属性是比较完善的,除了知识获取算法本身的问题外,还有如下影响性能的因素:
(1)对邮件分类的定义不太明确,主要是没有明确定义广告邮件和一般邮件间的差异,如某网站成功注册的认证信件和朋友发送的电子贺卡,这些信件从内容看是一般信件,但往往这些信件的信头信息有诸多疑点,严重影响决策性能;
(2)很多SMTP邮件服务器添加的“Received:”信头不规范,它们不能完整的填写该信头的各项内容,带来原来并不存在的信头疑点;
(3)利用正当路由,发送广告或反动邮件,会导致决策错误。
因此,我们下一步的工作:一是将3节讨论的概念系统架构与Rough集理论进一步有机结合,寻求更优解决方法;二是研究邮件描述语言的替换(如XML),获得更有效的向量、决策表示。
参考文献毕业论文
http://www.751com.cn1、Internet电子邮件资源及应用大全 Will Salidle著 清华大学出版社 1996
2、王兰波等 国内信息导航系统中的信息自动分类子系统的设计与实现 计算机工程与应用 2002年3期
3、Yang. Y ete. A Comparative Study on Feature Selection in Text Categorization. In: Proc. Of the 14th Intl. Conf. on Machine Learning ICML97, 1997本文来自辣'文~论^文,网
4、罗万伯等 E-mail的数据安全和内容安全 计算机应用 2002年3期
5、张晓冬等 信息过滤的模糊聚类模型 计算机工程与应用 2002年9期
6、陈细谦等 基于Qmail的邮件过滤系统的设计与实现 现代计算机(下半月刊) 2001年9期
7、王国胤 Rough集理论与知识获取 西安交通大学出版社 2001
8、张 弋 粗集智能数据分析系统——RIDAS 重庆邮电学院硕士学位论文 2002.5
9、Y.Y.Yao Information-Theoretic Measures for Knowledge Discovery and Data Mining
上一页 [1] [2] [3] [4]
电子邮件垃圾安全过滤程序设计 第4页下载如图片无法显示或论文不完整,请联系qq752018766