论文部分内容阅读
随着信息时代的来临,人们面临着海量数据的挑战。如何从海量数据中提取出有用信息受到越来越多的关注。随着数据挖掘技术的发展与应用,聚类被证明是一种有效的工具。聚类本质上是无监督学习,目标是将数据集划分成为多个类,同一类内对象之间具有较高的相似度,不同类之间的对象相似度较小。从而达到分类的作用,一定程度上揭示对象间共性特征和本质区别。 人是如何通过视觉感知外部环境并做出反应是认知科学的主要研究内容。本文通过对猴脑下颞叶皮层(Inferior Temporal Cortex)神经元反应模式的研究来探索下颞叶皮层的功能及其编码信息。下颞叶层神经元的数量庞大,而且反应复杂,因此可以运用聚类分析这个手段研究该层神经元的编码方式,挖掘其中含有的信息。 本文对基于图的AP(Affinity Propagation)聚类算法进行了研究,以AP算法为基础提出了改进算法,并且将其应用在认知科学的研究中。具体工作如下: 首先,对主流的聚类分析算法进行了综述。阐述了聚类的概念以及聚类的一般步骤,介绍了已经研究成熟的不同种类的算法,并对其中几种代表算法详细描述。 然后,提出一种基于测地距离的AP聚类算法(GeoAP)。AP算法的缺点在于不能有效适用于任意形状的数据集,因此,将欧氏距离替换为能挖掘潜在流形特征的测地距离。在不同类型的数据集上,通过对比AP算法、GeoAP算法以及其它算法的聚类性能和运算时间,证明了改进的AP算法的聚类性能有明显的提高。 最后,应用聚类分析猴脑下颞叶层神经元受到视觉刺激时的反应模式,挖掘群体编码中包含的信息。针对日本理研脑科学研究中心的猴脑下颞叶层实验数据,得到以下三个结论:(1)验证了下颞叶层神经元群体编码含有目标分类的信息;(2)通过GeoAP证明人脸表情在下颞叶层神经元中编码是具有流形特征的;(3)通过AP和GeoAP两种聚类算法共同揭示了下颞叶层神经元群体编码存在奇异性。