基于代表熵的基因表达数据聚类分析方法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:wangsong1st
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对基因表达数据样本少,维数高的特点,尤其是在样本分型缺乏先验知识的情况下,结合自组织特征映射的优点提出了基于代表熵的双向聚类算法。该算法首先通过自组织特征映射网络(SOM)对基因聚类,根据波动系数挑选特征基因。然后根据代表熵的大小判断基因聚类的好坏,并确定网络的神经元个数。最后采用FCM(Fuzzy C Means)聚类算法对挑选出的特征基因集进行样本分型。将该算法用于两组公开的基因表达数据集,实验结果表明该算法在降低特征维数的同时,得出了较高的聚类准确率。
其他文献
SY410密炼机设备体积质量大、安装精度要求高.结合设备安装过程,较为详细地介绍该类设备的安装工艺.
《简.爱》是19世纪英国文坛一位著名的女作家夏洛蒂.勃郎特写的一个叫简.爱的女子的传记,也是作者自身的“诗意的生平”的写照。这是一部以爱情为主题的小说,女主人公简.爱是
太行山雄踞于河北省西部,处在华北平原上风口,是华北平原和京津地区的重要水源地和天然屏障。党中央、国务院于1994年正式启动实施了太行山绿化一期工程,使太行山区的造林绿
肌动蛋白是生物体生长发育的一个重要的调控因子,具有连接细胞膜、分子马达、参与细胞有丝分裂、维持细胞内部结构和细胞完整性及其他细胞生物学方面的众多功能。本文重点介