论文部分内容阅读
在很多实际回归应用中,我们都面临着由于非线性关系、异质体的存在、或者时间序列等的存在导致的难题,即需要两个或者更多的回归函数才能更好地描述数据的实际结构.但不幸的是,在很多情况下,哪些样本属于哪个回归类事先是未知的,而且在很多实际应用中,样本总共有多少回归类也是未知的.聚类回归的目的就是将数据划分为几类,同时为每类数据找到近似的回归函数.其中,最简单也最为关键的聚类回归方法为聚类线性回归.已有很多学者对其进行了深入研究,使得该方法在经济、医学、地质学等领域得到广泛应用. 本文针对聚类线性回归的研究主要是分两步进行分析.首先,结合非光滑非凸算法来给出真实分类数k0的相合估计,该方法能保证在概率结构总体下,当样本量趋于无穷大时以概率1得到真实的分类数.其次,在分类数k已知的情况下,利用非光滑非凸的最优化算法来得到全局或近似全局最优解(若数据足够稠密).该方法是通过极小化非光滑非凸的目标函数,逐步增加分类(增加到k类时停止),每步迭代中都给出解决全局最优问题的较好的初始点. 为了说明该算法的有效性,文章给出了该方法的模拟研究.最后也结合实际应用,利用该算法来解决农民工分层问题.