论文部分内容阅读
时间序列数据在生产与生活中普遍存在,已有不少学者对时间序列挖掘技术进行研究。随着研究深入,一元时间序列挖掘技术逐渐成熟,其在金融证券领域也得到广泛应用。例如,利用时间序列分析证券市场的特征,进行交易建议等。金融时间序列分析成为金融研究中的重要方向。多元时间序列数据同时利用多个指标描述对象,其表达的信息,隐藏的知识远远多于一元时间序列。但是由于其高维性和复杂性,目前对于多元时间序列的研究相对不足,在金融应用方面也缺少基于多元数据的分析。本文针对多元时间序列聚类技术从不同角度出发,提出两种新的多元时间序列聚类模型:(1)引入属性权值和模糊隶属度矩阵提出一种属性加权的多元时间序列聚类方法。该方法根据不同维度数据的离散程度赋予相应维度不同权重,并通过距离信息将原始多元时间序列转换为模糊隶属度矩阵。最终,通过模糊均值聚类得到聚类结果。仿真实验证实该方法能够有效提升多元时间序列的聚类质量,适用于指定类簇的多元时间序列聚类。(2)提出一种无参数聚类方法,从复杂网络角度将基于社区发现的一元时间序列聚类拓展到多元时间序列数据中。新方法通过综合考虑多元时间序列数据在各个维度上的多个最近邻居数从而避免聚类过程中的参数选择。新方法能够自适应地确定数据集中的社区数量,实现多元时间序列的无参数聚类。仿真实验中证实,新的聚类方法在减少参数的同时保证了聚类结果的质量及聚类效率,并适用于聚类无先验知识多元时间序列数据集。此外,本文将所提出的两个新聚类模型与金融证券市场结合从而指导投资决策。首先,利用基于社区发现的无参数聚类方法找到多元股票数据集中存在的社区结构,确定适宜的聚类簇数。随后,利用属性加权的聚类方法得到最终聚类结果。依据该聚类结果提出两种不同目标的选股策略,结合马科维兹模型对选股策略进行了有效性检验。实验中证实利用新的聚类模型结合选股策略的投资组合其收益率优于对比算法与市场基准,对投资者具备参考价值。