论文部分内容阅读
电子邮件(Email)是人们通过Internet进行信息交流的主要手段。本文对集群邮件系统进行了深入研究,在分析现有集群邮件系统不足的基础上,提出了一种新的分布式集群邮件服务系统:DCMS。DCMS是一种通用的集群系统框架,系统由前端中转集群、服务集群、验证集群和后台存储集群四个子系统组成。本文详细阐述了各个部分的组成、功能及性能优化策略,并进一步探讨了集群邮件系统的两大关键技术:负载均衡和垃圾邮件过滤。
为了最大化地提高DCMS系统的整体性能,本文提出了面向集群邮件的自适应负载均衡调度系统。一方面,在实际应用中,负载均衡调度是一个复杂的数学问题,节点类型的不同、资源类型的多样性以及节点和任务的动态行为都大大提高了负载均衡调度的复杂性;在另一方面,在负载均衡调度领域已经有许多可供选择的基础调度算法,但是没有一种负载均衡算法可以适应所有应用情况。因此,本文在详细分析邮件系统提供的各种服务的基础上依据不同的服务请求提出了自适应负载均衡调度框架,并详细阐述了各种服务请求的负载均衡调度。
为了提高DCMS的实用性,必须为其提供垃圾邮件的过滤能力。由于汉语复杂的语义环境和贝叶斯概率模型的不可靠性,使得基于贝叶斯概率模型的过滤系统不能很好地过滤中文垃圾邮件。针对上述问题,本文引入粗糙集理论,利用粗糙集能有效处理不确定、不完备信息的优势,进行邮件特征属性的约简,之后,利用前馈神经网络的智能分类能力过滤垃圾邮件。最后,为了在实践中检验所提出的方法,本文结合Linux操作系统和部分开源项目软件,讨论了DCMS的设计与实现方案。该方案采用单级中转的负载均衡结构,具备两个服务节点,后台存储采用NFS来实现。根据此设计方案完成了主要部分的实现工作。为检验DCMS系统的实际应用效果,本文对基于Linux搭建的系统设计了实验测试方案,进行了一系列实验。