论文部分内容阅读
2003年4月,随着破译生命密码的人类基因组计划完成,后基因组时代已经拉开序幕,如何利用人类基因组计划所测得的数据进行研究,发现基因的编码规律、基因表达网络的调控规律,这对当代科学家提出了严峻的挑战。 肿瘤基因治疗急待解决的关键问题之一就是如何调控目的基因对肿瘤进行专一性表达。要达到这一目的方法之一就是应用肿瘤特异性启动子,因此如何寻找肿瘤特异性启动子就具有非常重要的意义。 随着人类基因组计划的完成、功能基因组学的发展,大量的生物序列数据已经存储在公共数据库中,如何应用生物信息学技术、利用国际互联网络,以现有序列的已知功能和序列数据为基础,开展基于计算机技术的肿瘤特异性启动子识别方法研究,这对于肿瘤的基因治疗、已知和未知功能基因的表达调控序列的确定、相互作用规律的阐明,都具有很好的指导作用。 本文通过研究肿瘤特异性启动子的生物学特点以及相关数据,利用国际互联网络获取的生物序列数据为基础,提出了两种利用转录因子结合位点为特征的肿瘤特异性启动子计算机识别方法,并验证了两种方法的有效性。研究结果表明:两种方法都具有较好的识别效果,是可行的利用计算机技术进行肿瘤特异性启动子识别的方法。 本研究主要目的在于: 1、对后基因组时代国际互联网上生物学测序所获得大量序列数据进行研究,从相关生物数据库提取信息,开展序列内部隐含信息的挖掘。 2、研究肿瘤特异性启动子计算机识别的方法,为基于计算机技术的肿瘤特异性启动子识别研究探索方向。