利用贝叶斯网络模型推断基因调控网络方法的比较研究

来源 :中国农业大学 | 被引量 : 0次 | 上传用户:sulinpep
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在利用基因芯片的高通量特性的情况下,研究者们希望利用这些数据获得基因间的调控关系,提出的推断方法很多,如布尔网络、相关分析、微分方程、贝叶斯网络等。本文研究了现在较为热点的贝叶斯网络模型,主要对它的结构学习算法进行了比较分析,期望找到适合分析基因表达数据的特异性结构学习算法。具体比较的算法有K2、马尔可夫链蒙特卡洛(MCMC)和贪婪搜索(GS)三种。 当样本小于10时,很难获得数据间的正确关系。随着样本量的增多其推断出的结构与真实图相近,随着样本量的增多其推断出的结构与真实图相近,利用MCMC法在基因数为5时需要50个芯片数据;基因数为9和11需要100个芯片数据;基因数为13时需要200个芯片数据。利用k2算法在给定合适的顺序的前提下与MCMC算法情况相似,但其需要提供有效的先验信息,这一点是其推断网络结构的最大限制。利用GS算法在基因数目在13个以下时都需要约200个样本,当将基因数增加到20,这时约需要1000个样本。 K2在给定适合的先验顺序后可推断出较准确的结构,且推断速度很快,但其缺点是对先验的依赖性强。利用MCMC算法不需要任何先验值,在样本量达到100时会在60-85分钟的时间内学习出小于15个基因的调控网络。GS算法所需要的样本量较大,消耗机时较长,且获得的值多为局部最优解,本实验建议舍弃此法。 利用k2、GS和MCMC三种算法学习部分细胞周期网络所获得的结果其正确率在20%~35%间。但利用ASIA非基因表达数据这三种算法在芯片数达到100、100和200时都能获得正确的结构图。
其他文献
本试验针对食用鸡胚蛋对动物生长发育和生理的影响开展了研究,试验动物分别采用小鼠和大鼠。 将80只21日龄刚断奶的近交系小黑鼠随机分为2组,每组40只(雌雄各半),正常条件下
2006年高考已尘埃落定。笔者与一位校长聊天时,顺便问起了该校的高考成绩。闲聊中,这位校长的“忧虑”引起了我的注意。该校去年一位女生被清华大学录取,这位校长忧虑的是今
硫酸乙酰肝素6-O硫酸基团转移酶2 (HS6ST2)是一种特异性硫酸化修饰硫酸乙酰肝素蛋白聚糖(HSPG),硫酸乙酰肝素糖链(HS)上6-O硫酸基团位点的酶。已有研究结果表明HS6ST2基因参
每年九月,纽约市数以万计的小学五年级学生涌向初中。其中只有相对较少的学生有幸进入自己选择的学校。本文将首先使读者了解纽约市学校系统的运作机制——家长及其孩子选择
如果说中小学时期对社会上各种思潮的辨别筛选来自学校和家庭的话,相对开放的大学教育则把这个权力更多的下放到了学生本人.高校德育提纲挈领与时俱进抓住大学教育特点和学生
世界发达国家的历史表明,要使教育适应经济社会的发展需要,必须有一套完整的教育体制和政策作保证,我国的教育体制和教育政策要从我国的国情出发,也要注意吸取发达国家发展教
一、教育“管办评联动”机制的由来rn自上世纪80年代始,西方出现了一种新的公共行政理论和管理模式--新公共管理(NewPublic Management),它以现代经济学为理论基础,主张在政
当代中国民办教育的复兴,促进了民办教育协会的发展.作为典型的教育中介组织,各省、市民办教育协会在推动区域民办教育方面发挥着不可或缺的作用.然而,由于历史的原因,中国的
提高课堂教学效率要求教师必须引导学生明确自主学习规范、掌握纲要信号作为自学工具;必须整体学习教材,培养整体思维方式;必须把知识作为培养能力的例证,引导学生掌握学习方
课程实施是一个开放、创造、动态、生成的过程,在此过程中,随时都可能出现生成性课程事件.本文剖析了实践中教师对生成性课程事件的不当处理方式,从复杂思想的角度论述了教师