DNA文库中Barcode的设计

来源 :东北农业大学 | 被引量 : 0次 | 上传用户:zhufeng19791123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本研究旨在为高通量测序时DNA建库设计barcode,用于在一次测序中获得更多的基因型数据,降低测序成本为后续的全基因组关联分析和基因组选育提供基因型数据。基因测序的出现极大的推动了生物科学领域的发展。在过去的30年里由英国生物化学家Sanger发明的DNA测序法取得了无数的科研成果。人类基因组测序计划推动了二代测序的产生与发展,由于其通量高、自动化程度高、成本低在几年内便迅速地应用在生命科学领域。Barcode是指链接在测序接头后的一段用于区分测序分析时基因型数据来源的碱基序列。测序过程中,DNA文库构建时在样品上添加barcode后混合,可在一次测序中获得几十甚至上百个个体基因型数据,在后期数据分析时利用生物信息学软件以条码序列为依据区分不同样品,能够显著降低测序成本。目前已公开的barcode有Illumina公司的12个、美国科罗拉多大学博尔德分校的丹尼尔所发表的设计的barcode的软件、康奈尔大学的96个和和华中农业大学的96个。其中康奈尔大学的96个针对Apek I酶,Illumina公司的只有6碱基的barcode 12个,美国科罗拉多大学博尔德分校的丹尼尔所发表的设计的barcode的软件只能产生8位的接头并且而华中农业大学的96个针对Mse I酶和Sac I酶。根据前人的研究不同的物种在DNA建库时需要不同的限制性内切酶,已公布的barcode并不能完全满足当前科研的需要,急需一种能够简易设计barcode的程序。R语言是一种应用面非常广的计算机语言,特别是在基因测序所产生的测序数据中有很好的应用。能够解决基因测序过程中大量数据的查询、调用、储存问题所产生的时间间隔等问题。本试验采用R语言对barcode进行设计,步骤如下:(1)设定barcode长度为3-11碱基对(bp),将A、T、G、C分别替换为数字1、2、3、4,应用R语言中的排列组合语句,生成数字的全排列组合。(2)将特异序列编码置换成数字形式,应用R语言中的删除语句,删除特异序列。删除起始密码子,终止密码子等特殊序列。(3)删除重复序列。删除连续三位重复的碱基序列,保证碱基的平衡度与复杂度。(4)根据特定限制性内切酶的酶切位点设计R语句,删除相应的组合。(5)数字与字母进行替换。将以上删除步骤结束后的数字替换成碱基字母。试验完成了3-11位的barcode设计,其中3位初始排列64个,4位初始排列256个,5位初始排列1024个,6位初始排列4096,7位初始排列16384,8位初始排列65536,9位初始排列262144,10位初始排列1048576,11位初始排列4194304。经过第二步和第三步筛选后剩余:3位剩余55个,4位剩余191个,5位剩余660个,6位剩余2294,7位剩余7948,8位剩余27539,9位剩余95418,10位剩余330607,11剩余1145498。前人试验中曾经应用过3-8位的barcode,通过本次研究的语句3-8位barcode,共产生87360个排列组合,删除特异序列后共55431个排列组合,除重复序列后共38689个排列组合,删除酶切位点后(以Apke I为例)共38191个排列组合,为barcode的进一步设计提供必要的研究基础,在以后的设计中,可以根据设计出的数据进行下一步的筛选,本研究已将此方法生成R脚本程序,方便调用。
其他文献
目的了解血液透析联合血液灌流发生凝血的情况,分析其因素。方法对我科15例血液灌流治疗的患者进行研究,收集患者临床资料和生化指标,分析发生凝血的发生率和因素。结果 15例
穆时英(1912-1939),30年代中国新感觉派著名作家,他的创作受到日本文学和西方现代派文学的影响,运用新感觉主义、意识流、心理分析等手法,表现那个时代的城市生活,被誉为“新感觉派圣手”、中国
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
近几年我国资本市场股票价格暴涨暴跌的幅度引发广为关注,尤其是股价暴跌所引发的股价崩盘,对中国证券市场的安全构成了巨大隐患。2016年起,A股市场连续发生“千股集体跌停”异象,严重阻碍我国资本市场的良性发展。目前我国正处在经济转轨时期,降低公司未来股价崩盘风险并研究其影响因素刻不容缓。缓解公司信息不对称程度,避免管理者自利性“捂盘”行为是降低股价崩盘风险的关键所在。随着我国“创新、协调、绿色、开放、
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技