【摘 要】
:
k最近邻分类算法原理简单且分类性能好,但因其时间复杂度高,不适用于实际领域在线垃圾邮件过滤.本文在建模阶段首先对训练邮件进行初始聚类,将训练邮件划分为半径大小几乎相
【机 构】
:
广东外语外贸大学信息学院,广州,510006
论文部分内容阅读
k最近邻分类算法原理简单且分类性能好,但因其时间复杂度高,不适用于实际领域在线垃圾邮件过滤.本文在建模阶段首先对训练邮件进行初始聚类,将训练邮件划分为半径大小几乎相同的初始簇,然后使用共享最近邻图聚类算法对包含邮件的初始簇进行再聚类,最终聚类簇被看成是可以增量更新的分类模型,最后使用经典k最近邻分类算法在该分类模型上对未知邮件进行分类.在公开语料Ling-Spam上的实验结果表明,本文提出的垃圾邮件识别算法不仅具有较高的垃圾邮件识别精度,而且还具有较低的时间复杂度.
其他文献
给出了一种基于全阶模型参考自适应速度观测器的感应电机速度和磁通控制策略。该控制策略能确保转子速度和转子磁通幅值准确跟踪参考值,且对转子时间常数的漂移和负载转矩的变化具有强鲁棒性。控制器的结构由开环和闭环两部分组成,其中开环控制器确保控制信号能够准确跟踪期望值,闭环控制器由实现系统鲁棒镇定。所采用的速度观测器在低速条件下性能良好,观测结果明显优于传统速度观测器。仿真结果验证了该控制策略和速度观测器的
新时期政府提出了“营改增”的税收政策,是为了减小征税基数,降低征税额度,减轻企业负担,有利于企业快速发展;有利于促进企业内部体制改革,通过这一政策的推行,避免了重复征
4月,最牵动人心的莫过于H7N9这个名词了.受此影响,我国禽肉类市场交易陷入低谷.不过此前普遍低迷的水产品价格却因此有了一些起色.很难说这消息是好是坏.对于水产业者来说,水
1.等级保护技术需求要点分析rn自2008年度开始,等级保护将逐步进入规划设计和安全实施阶段.在规划设计阶段,如何从组织整体出发,从大处着眼统筹考虑系统面临的安全性问题,对
随着我国经济建设的快速发展,极大的促进了我国市政基础设施项目的建设与发展.然而随着市场机制的不断改革和完善,市政施工企业所面临的市场竞争越来越大.在这样的背景下,在
淀粉膜成膜载体的筛选组合,是解决限制淀粉膜产业化的关键因素之一.分别采用玻璃板、塑料板、铝板、不锈钢板、有机玻璃、特氟龙树脂板和特氟龙涂层板,糊化液质量浓度50g/L,
近些年来,我国的科技水平不断提高,在这一背景下建筑行业也实现了一定的发展.在建筑工程逐渐崛起的过程里,相关工作人员逐渐加大了对建筑工程造价的重视力度,近些年来加大了
PXI 8170 /85 0RT控制器基于PXI/CompactPCItNT公司的LabVIEW实时技术。这种具有以太网功能的控制器使用PentiumIII 85 0MHz的处理器来加强实时操作系统的确实性和可靠性。PXI 8170 /85 0RT具有比PXI 815 6B/333RT控制器
The PXI