【摘 要】
:
针对基因表达数据样本少,维数高的特点,尤其是在样本分型缺乏先验知识的情况下,结合自组织特征映射的优点提出了基于代表熵的双向聚类算法。该算法首先通过自组织特征映射网
【基金项目】
:
国家自然科学基金(the National Natural Science Foundation of China under Grant No.60674029).
论文部分内容阅读
针对基因表达数据样本少,维数高的特点,尤其是在样本分型缺乏先验知识的情况下,结合自组织特征映射的优点提出了基于代表熵的双向聚类算法。该算法首先通过自组织特征映射网络(SOM)对基因聚类,根据波动系数挑选特征基因。然后根据代表熵的大小判断基因聚类的好坏,并确定网络的神经元个数。最后采用FCM(Fuzzy C Means)聚类算法对挑选出的特征基因集进行样本分型。将该算法用于两组公开的基因表达数据集,实验结果表明该算法在降低特征维数的同时,得出了较高的聚类准确率。
其他文献
SY410密炼机设备体积质量大、安装精度要求高.结合设备安装过程,较为详细地介绍该类设备的安装工艺.
《简.爱》是19世纪英国文坛一位著名的女作家夏洛蒂.勃郎特写的一个叫简.爱的女子的传记,也是作者自身的“诗意的生平”的写照。这是一部以爱情为主题的小说,女主人公简.爱是
太行山雄踞于河北省西部,处在华北平原上风口,是华北平原和京津地区的重要水源地和天然屏障。党中央、国务院于1994年正式启动实施了太行山绿化一期工程,使太行山区的造林绿
肌动蛋白是生物体生长发育的一个重要的调控因子,具有连接细胞膜、分子马达、参与细胞有丝分裂、维持细胞内部结构和细胞完整性及其他细胞生物学方面的众多功能。本文重点介