主要作物EST分析系统的构建及应用

被引量 : 0次 | 上传用户:jonathanwu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
植物基因组学的发展产生了一大批有价值的数据,EST(expressed sequences tag)是其中的重要组成部分。利用生物信息学的原理和方法发掘这些海量数据中蕴藏的信息,已成为当前基因组学研究的一个重要组成部分。本研究主要进行以下两方面的研究。 针对大规模分析主要作物EST的需要构建了多功能自动化的分析系统。同时为了方便本实验室相关研究,本系统还增加了生物信息服务功能。因此,本研究所开发的主要作物EST分析系统分为数据分析和生物信息服务两部分,数据分析部分是整个系统的核心。它包括EST-SSR(simple sequeilce repeat,SSR)发掘系统、电子克隆系统、本地化blast(blast basic local alignment search tool)分析系统、EST序列拼接系统和cSNP(single nucleotide polymorphism,SNP)发掘系统共五个子分析系统。这五个子系统是利用新开发的数据挖掘软件并有机结合已有的软件构建的。本地化blast分析系统是在将NCBI的blast系统本地化基础上加入了新的数据库和新开发的blast结果处理程序如同源性分析程序和自动注释程序。EST序列拼接系统是用目前常用的序列组装程序Cap3和Phrap根据EST特点开发的。cSNP发掘系统包括两个子系统:一个是处理大量EST,从中标出可能的SNP位点;另一个是逐条处理提交的EST,从EST数据库中找到与其同源的序列然后鉴别候选SNP。EST-SSR发掘系统的核心程序SSRFinder是自主开发的,它不但可从大量EST中发掘精确SSR(perfect SSR)和复合型SSR(compound SSR),而且还能比较准确地进行统计分析。另外以Phrap和Cap3为核心用自己设计的算法开发了电子克隆程序。生物信息服务部分包括web方式的EST分析系统以及各类序列、结果的管理信息系统,提供在线数据分析和查询服务。 应用自主构建的主要作物EST生物信息分析系统对小麦、水稻、玉米等主要作物的EST进行了分析,主要包括五方面研究:(1)几种主要作物同源性的比较分析,分别用E值(1e-6)和同源性分析程序(整体相似性高达50%)分析了小麦、大麦、水稻、玉米等的同源性,发现小麦与大麦同源性最高,其次是与水稻,第三位是小麦与玉米的。(2)几种主要作物EST-SSR的分析。分析了公共数据库中获取的小麦、水稻、玉米和大豆EST中1—6碱基重复单元SSR的种类和分布频率,表明水稻EST中的EST-SSR比其它的丰富,其分布频率为11.81kp一个SSR;小麦为17.42kp,大豆和玉米的分别为23.80kp和28.32pk。三碱基重复的SSR是六类SSR中最丰富的一类。单子叶在三碱基和六碱基重复的SSR中富含GC,特别是水稻。(3)几种主要作物EST和SSR-EST(SSR-containing EST)的比较分析。比较分析小麦、玉米、大豆的EST和SSR-EST,发现小麦、玉米分别与水稻同源的SSR-EST明显少于小麦、玉米与水稻同源的EST。从101299条小麦同源于水稻、玉米、大麦的EST中发掘出1707条SSR-EST。(4)小麦遗传图与水稻物理图的比较。将164个小麦的遗传标记序列和水稻的基因组序列进行了比较,发现有94个标记与水稻同源,将这些同源的序列定位在水稻基因组上,为小麦—水稻的比较作图增加了新内容。(5)几种主要作物表达基因数目的预测。用EST序列拼接系统对小麦、水稻和玉米的表达基因数目进行了预测,如从160000条小麦EST中得到了4万多个表达基因。
其他文献
<正> 甘地一生为争取印度独立多次领导非暴力不合作运动,最后一次是准备开展著名的“退出印度”运动。要求英国立即退出印度,这是他在1942年第二次世界大战中印度面临紧急关
保证药物临床试验过程与结果的科学性和可靠性一直是临床试验质量控制的重点和难点。本文主要从试验设计、组织、实施、监查以及总结等方面对目前我国药物临床试验存在的若干
随着信息化建设的不断推进,人民银行要顺应“大数据”时代潮流,构建和挖掘“大数据”,提升运用“大数据”分析预测能力.为制定国家经济金融政策提供重要决策参考。本文以人民银行
市场经济体制的确立和社会生活的繁荣,促进了城市社区意识的觉醒,打破了计划经济时代传统的国家强控制城市管理格局。面对体制转换、社会结构转型所带来的巨大变化,政府应该理性
中国旅游史的研究是伴随着中国旅游学术研究和旅游专业高等教育而发展起来的,已经有了较多的成果,表现出研究课题选材覆盖面比较宽广,研究深度可观的特点。但发展不很均匀,具体考
以四川省内江市区域经济为例 ,运用人工神经网络方法 ,定量分析了影响区域经济各因子的主次顺序 ,为高速公路社会效益量化的变量选择提供了一种研究方法。应用人工神经网络选
<正>20世纪60年代以来,许多类型的避孕药物制剂取得了一定的发展,各种激素类与非激素类避孕制剂对提高妇女的生活质量起到了重要作用。根据不同人群的不同避孕需求,各研究机
家庭教育是教育的重要组成部分。改善和优化农村家庭教育,对提高我国的人口素质,加快我国现代化建设步伐,实现十六大提出的全面建设小康社会的战略目标意义重大。但目前我国农村
问题意识的培养对于大学生的创新精神的培养具有十分重要的作用,没有问题意识,创新精神及创新活动将无从谈起。本文在分析当今大学生问题意识缺失成因的基础上,探讨了当代大
目的观察ω-3多不饱和脂肪酸(ω-3PUFAs)对术后早期炎性肠梗阻(EPISBO)的临床疗效及其对血清白介素-6(IL-6)、肿瘤坏死因子-α(TNF-α)的影响。方法入选EPISBO患者60例,随机