论文部分内容阅读
随着文化建模的发展,背景知识开始用于预测恐怖组织在特定背景下的恐怖行为。组织的背景知识会影响组织采取的恐怖行为,因此利用组织的背景知识可以提高预测结果的准确率。目前,利用背景知识预测恐怖行为的预测算法大都在全局背景知识空间中利用单一算法进行预测。但是全局情况下的高维空间会导致距离函数失效以及数据稀疏问题,从而对预测结果产生影响。另外,背景知识数据集中的某些恐怖行为会存在类分布不平衡问题,进而会对预测算法产生影响,导致预测精度降低。
因此,利用背景知识预测恐怖行为需要:1)针对不同恐怖行为提取与之对应的背景属性特征子空间,然后在背景子空间中进行预测,从而避免全局背景空间中距离函数的失效以及高维空间中数据稀疏对预测算法造成的影响;2)对于存在类不平衡的恐怖行为,提取背景子空间后,要解决类不平衡对预测算法的影响。论文的主要工作如下:
(1)根据背景知识数据集高维、小样本的特性,在分析目前降维算法的基础上,提出改进的谱聚类降维算法SCBAA(SpectralCluster Based on AttributesAssociation)用于提取不同恐怖行为的背景子空间。SCBAA算法利用背景属性与行为属性的相似度构造背景属性之间的耦合图,从而把稀疏的原始记录图转化为稠密的背景属性图。对于SCBAA算法而言,新增加的数据点只对图中的权值造成影响,不会对图中的顶点造成影响。因此,当有新增数据点时,只需要遍历数据集计算属性节点之间的相似度,然后修改图的权值即可。因此,SCBAA算法把传统谱聚类的时间复杂度降为0(N)。
(2)提出一种改进的SVM算法用于解决背景数据集中的类不平衡特性对预测算法造成的影响。改进算法引入样本数量控制参数以及权重参数调整SVM的分类决策函数,尽可能提高少类样本对分类器的贡献,使分类平面向多类样本倾斜,从而解决类不平衡对SVM造成的影响。然后利用改进的SVM算法预测恐怖行为,避免背景数据集中的类不平衡性对预测算法的影响。
(3)为验证本文提出算法的有效性,采用面向对象设计思想,利用C#语言在Microsoft Visual Studio2010开发平台上,设计并实现一个基于背景知识预测恐怖行为的原型系统。
本文的创新点有:
(1)提出在背景子空间中针对不同的行为采用不同的预测算法,而不像传统预测算法在全局背景空间利用单一的预测算法;
(2)提出基于属性相似度的谱聚类的降维算法SCBAA算法,在保证预测精度的同时把传统谱聚类的时间复杂度由0(N3)降为0(N);
(3)提出基于分类后处理的SVM算法预测存在类不平衡的恐怖行为,解决预测过程中的类不平衡特性对预测算法的干扰。