论文部分内容阅读
回归分析是一种常见的数理统计方法,在处理大量的数据时发挥了很有效的作用,所以吸引大量学者与专家学习以及研究,通过对回归分析法理论方面的不断改进与完善,使得该理论在实验方面显示出突出的优点,而且给实际生活提供了非常大的帮助。因此回归分析不仅在数学理论研究方面是一个热点,而且对实际生活应用有重要的预测与指导意义。然而根据自变量的值对一个样本预测的结果只能有一个值,也就是说通常我们应用传统的回归分析方法只能得到一个模糊的预测值。而据目前科学理论可知,预测值通常是不确定的,但其会在一个范围内变化。因此,我们根据模糊粗糙理论,提出一种新算法来给出预测值的变化范围,即预测值的上下近似。本文新提出的回归算法包括利用邻域粗糙集进行属性约简、求模糊相似矩阵、求模糊近似以及回归预测等步骤。该算法的大致思路是两种理论方法的结合:回归分析方法、模糊粗糙集理论。首先用模糊粗糙理论求出属性值的上、下近似值,然后分别对上、下近似值作回归分析。与传统的回归分析法不同,用以前的回归分析可以得出属性值的一个预测值,而运用本文的算法最终可以得到两条预测回归曲线,而属性值正好落入这两条预测曲线之间。本文选用UCI数据集对上面介绍的新算法进行了实验验证,实验结果表明利用该算法对决策属性值作预测还是有实用价值的,可以给出预测值得一个明确范围,尽管这个范围还不是太精确。本文的研究内容主要包括以下两个部分:首先,介绍了基于经典的粗糙集理论的属性约简过程,为了解决当样本属性值为数值型数据时的问题,所以研究且提出了基于邻域粗糙集理论的属性约简方法。介绍了理论后,又分别针对小样本数据、大样本数据给出了计算过程以及相应的程序。其次,提出了一种新的基于模糊粗糙集的回归分析方法,这种方法主要思路是回归分析法与模糊粗糙集理论的结合。首先首先用模糊粗糙理论求出属性值的上、下近似值,然后分别对上、下近似值作回归分析。主要包括求模糊相似矩阵、求模糊近似以及回归预测等运算步骤。