基于RNA-Seq的杜仲转录组微卫星特征分析

来源 :中国农业大学学报 | 被引量 : 0次 | 上传用户:ding89629
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对杜仲(Eucommia ulmoides)国审良种‘华仲6号’和‘华仲10号’花后70和160d的种仁共4个样本进行转录组测序,对测序数据进行组装和功能注释分类,并对转录组获得的单基因簇(unigene)进行微卫星特征分析。利用新一代高通量测序技术Illumina HiSeq~(TM)2000对杜仲样品进行转录组测序,采用软件Trinity进行组装;利用BLAST软件将unigene序列分别与Nr、GO、COG和KEGG等数据库比对分析;利用MISA软件对转录组的96 469条unigenes进行SSR搜索。结果表明:转录组测序分析,共得到72 791 399个高质量的序列读取片段(Clean reads),包含了14 702 548 161个的碱基序列(bp)信息。对reads进行序列组装,共获得96 469个平均长度为690bp的unigene,序列信息量达到了66.56 Mb。同源性分析结果显示,有49 856个与其它物种同源的unigenes得到注释,占All-unigene的51.68%。将杜仲转录组中的unigene与GO数据库进行比对分析,根据其功能可将注释到的38 983条unigene分成3大类(细胞组分、分子功能和生物学过程)56个分支;根据COG功能可将注释的14 796条unigene基因划分成25个类别;KEGG数据库作为参照,可将注释到的11 260条unigene定位到117个代谢途径分支;SSR位点搜索结果显示,96 469条unigenes中共包含9 621个完整型SSR位点,占总SSR位点的84.14%。完整型SSR位点共包含55种重复基元,其中出现频率最高的重复基序类型为单核苷酸重复中的A/T(4 597个),其次是AG/CT(2 597个)、AT/AT(439个)。 Four samples of seed of 70 and 160 days after flowering of ’Eucommia ulmoides’, ’Hua Zhong 6’ and ’Hua Zhong 10’, were sequenced and their sequencing data were assembled and function annotated The microsatellite features of unigene obtained from the transcriptome were analyzed. The new generation of high throughput sequencing technology Illumina HiSeq ~ (TM) 2000 transcriptome sequencing of the Eucommia ulmoides samples, using software Trinity assembly; unigene sequences were BLAST software, respectively, and Nr, GO, COG and KEGG database comparison analysis; SSR search was performed on 96,469 unigenes in transcriptome using MISA software. The results showed that there were 72 791 399 high quality sequence reads and 14 702 548 161 base sequence (bp) information in the transcriptome sequencing analysis. A total of 96 469 unigene averaged 690 bp in length were obtained, and the sequence information was 66.56 Mb. Homology analysis revealed that 49,856 unigenes homologous to other species were annotated, accounting for 51.68% of All-unigene. According to its function, 38 983 unigene annotated were divided into 56 branches in 3 major categories (cell component, molecular function and biological process); According to COG function The 14 796 unigene genes annotated can be divided into 25 categories. KEGG database as a reference, 11 260 unigene annotated can be mapped to 117 metabolic pathway branches; search results of SSR loci showed that 96 469 unigenes contained 9 621 complete SSR loci, accounting for 84.14% of the total SSR loci. The complete SSR loci contained a total of 55 kinds of repeat motifs, of which the most frequent repeat motifs were A / T (4 597), followed by AG / CT (2 597) AT / AT (439).
其他文献
无纺布不但具有排水、反滤、防渗等透水性能,还具有 防冲、加固、隔离、包容等 力学性能,被广泛应用于水利工程中。文中对无纺布应用于挡土 墙工程做了论述和介绍。 Non-woven
采用上海树脂厂有限公司环氧树脂厂生产的改性环氧树脂及其配套固化剂助剂制成的环氧沙浆料,在全国重点工程一黄河小浪底水利枢纽工程的招标中,凭借优良的物理机械性能,从国内外
7月20日,成都院胡敦渝院长和四川南桠河水电开发公司段凌剑总经理在南桠河冶勒水电站技施设计(含招标文件编制)阶段勘测设计合同文本上郑重签字,标志着冶勒水电站建设进入了
始建于公元前111年、作为郡县治所长达2000多年的临贺故城位于古代疆域开发过程中从中原向岭南扩张的主要通道和节点区域——贺江流域,其发展兴衰和城市格局形成受到社会经济
我国东北大兴安岭深处的敖鲁古雅鄂温克人是以饲养驯鹿和狩猎作为主要经济来源的民族。他们不仅饲养驯鹿、食用驯鹿肉、喝驯鹿奶,而且,衣服、鞋帽以及“撮罗子”屋内铺的皮
一、自然环境诸暨市地处浙江中部偏北,位于东经119°p3’-120°32’,北纬29°21’-29°59’之间。总面积2316.24平方公里,其中海拔50米以下平原占34.27%,50~500米丘陵占60.58%,500米以上山地占5.17%。全境处于浙 First, the natural envir
论述了集体林权制度改革的主要做法与成效:主体改革还山还林于民;以林地流转为抓手,深化配套改革;培育新型经营主体,推进林业快速发展。指出集体林权制度改革中存在的主要问
通过总结双柏电站扩建设计工作 ,提出在对老电站的扩建、增容等技术改造中 ,所应考虑的一般设计原则和兼顾具体的技术和经济问题。根据电站的不同情况 ,因地制宜地采取切实可
秦风唐韵:西安旅游业发展之魂──略谈开发西安旅游业的大思路杨东西安自古帝王都,是块风水宝地.建国后又有了工业化建设,特别是改革开放以后,建起了现代化的国际机场、高速公路和
相对于传统的无机半导体器件,以有机半导体(特别是聚合物半导体)材料为基础的有机光电器件,可采用与传统印刷技术(例如喷墨打印、卷对卷印刷等)相结合的溶液加工方式制备低成