论文部分内容阅读
基因定位是生物信息学和统计遗传学中一个重要的研究课题迄今为止,研究人员已经发现了许多疾瘸的致瘸位点,但其巾主要都是以单基因疾病为主,换句话说,关于复杂疾病的基因定位到目前为止仍然是科学界的一个难题统计遗传学用于基因定位的方法主要有两大类,即连锁分析方法和关联分忻方法连锁分析主要是基于基因数据、表型数据通过统汁学的方法去划断感兴趣的基因位点与已知的际记位点M的相对位置该相对位置可以通过重组率这个参数来体现,因为熏组率和遗传距离二旨可以相互转化因此可以说,连锁分析中所要推断的重要参数之一就是重组率当然,这主要是参数方法;而非参数方法则用不到具体参数的推断近年,随着人类基因组汁划的顺利完成,用以基因图潜构建和荩因定化的方法都得到了许多新的发展关联分析方法在流行病学里广泛地应用,可以说该方法是寻找引起复杂痰病的基网位置的有效方法,其中,遗传际记与疾病关联可能是致病基因与遗传标记存在很强的连锁不平衡,也可能是遗传标记位点本身与疾病的发生存在关联性基因问的关联程度通常由连锁不平衡来刻画,连锁不下衡是群俸的性质,可以用群体的数据来推断连锁不平衡的程度。现在也把有关这方而的研究在文献中称为关联分析,在关联研究中,通过邻近位点形成的关联状态,我们将能检测到疾病的致病位点一旦找到致病基因的精确他置或一定的区域,将为进一步地治疗疾病起到致关熏要的作用本文的主要工作之一就是提出一种新的关联分析的方法(RTTFP),该方法是对已有文献方法的一种改进,通过两步检验能够使得对疾病位点的探测达到一定的功效,而且新方法要优于已有的方法(TTFP和TTFPBFA)同时,该方法能在一定程度上控制群体分层其次,我们还针对一个真实的数据集,提出了探测基因一基因,以及基因一环境交丌作坩的方法其中关键的一步就是如果所考虑的变异中包含罕见变异,则将同一基因内罕见变异合并,形成一个组台的罕见变异(cRV,,并将其看成一个新的变异进行研究新方法被用于鉴别KDR,基因和控制数量性状Q1的吸烟状态之间的交互作用最后,本文就仝基因组的数节性状位点定位进行了一螳研究,考虑了标记应点的数目较多时的数最性状位点的区间定位问题,提出一种懈决该问题的新思路。我们通过实例分析和模拟研究考察了新方法的可行性,并且通过和其他方法的模拟比较分析了新方法的优缺点。理论分析和模拟研究部显示新方法在实际应用中是可行的,可以用于数节性状位点的全基因组搜索。