论文部分内容阅读
本文提供并描述了一种基于综合性干涉实验分析与数学建模结合的策略,并作为一个示例用于鉴定人巨细胞病毒(humancytomegalovirus,hCMV)极早期基因增强子/启动子(MIEP)组织的三种转录因子(NFκB(p65),APl,和CREB)之间可能存在的功能合作关系。在我们的研究策略中,含有特定转录因子结合位点的短DNA片段被作为一种“诱饵”寡核苷酸(decoyODN),用于干涉转录因子在基因调控区的集结和组织。我们在综合性“诱饵”干涉条件下测量了两种与转录机制密切相关的功能(包括蛋白质-DNA结合,与RNA体外合成)的变化(断面数据,functionalprofiles);然后,我们将干涉实验的条件用二进制(0,1)编码的方式进行表述,从而引入了干涉空间和干涉点的概念-基于此,我们才能够将一个生物学问题转化为一种数学模型来求解。之后,我们用一组欠定方程来描述整个干涉实验的过程。当干涉条件的数据被引入到建立的数学模型中进行处理时,我们从三种转录因子可能产生的全部7种合作关系中,鉴定出有5种对功能具有显著作用(那么,就有可能真实存在)的合作关系。并且,我们发现在这5种合作关系中,p65参与的全部4种合作关系都被包含其中,而且,这些p65参与的合作关系对功能的贡献并不相同;更进一步地,我们发现,p65参与的合作关系对蛋白-DNA结合功能的贡献与对RNA合成功能的贡献是负相关的。与人们通常使用的比较分析策略相比,合作分析策略会使研究者对转录控制系统的理解更加接近全局和本质。因此,我们的研究为鉴定合作关系的功能提供了一种简便有效的系统生物学方法。我们在这方面的工作至少在以下三点具有意义,(1)为了更加自然合理地理解一个系统之所以能够维持其功能的原因,我们成功地将系统中对功能负责的对象从‘单个分子’转向分子之间的‘合作关系’;(2)我们采用简单的数学模型将一个复杂的生物学问题转化为求解线性方程组的过程。(3)我们揭示了多种反式作用因子的合作关系在一个基因转录中并存的现象,并实现了对它们在基因转录过程中的贡献进行定性和定量分析,这一结果为预测基因表达如何响应转录环境的变化提供了基础。利用我们建立的对基因表达调控的模型和数据分析方法,我们进一步对文献中大量报道的基因启动子缺失突变的数据进行了重新分析,给出了对这类方法进行效率评估和衡量基因调控复杂度的判断方法。另一方面,作为了解基因转录调控的必然途径,我们需要理解调控DNA上多个顺式元件的调控逻辑。在这方面的研究中,我们仍然以MIEP的转录控制作为一个研究案例。前人的工作表明,MIEP上具有的多个NF-κB位点和回文序列对MIEP功能变化或响应环境刺激均有很关键的作用,然而,目前还没有二者之间有功能沟通(functionalcommunication)的报道。因此,我们采用针对这两种位点进行干涉(位点突变或Decoy干涉),并测定MIEP的表达变化,我们将干涉条件如同上述表述为干涉空间的干涉点,把干涉后MIEP的表达变化简化为上调和没有上调两种方式,并用二进制(0,1)编码进行表述,从而获取了一组功能数据,这些数据只占理论干涉条件总数(共256组)的7﹪左右。为了从小样本数据中获取有效信息,我们采用近来在模式识别与关系预测方面应用很广的支持向量机(supportingvectormachine,SVM)方法对试验数据中隐含的规律进行统计学习。学习计算结果表明,(1)尽管我们获得的实验数据占总理论数据不到10﹪,然而实验数据仍是冗余的;(2)基于这种冗余性,我们可以找到实验数据的核心并总结规律,那么,采用这个数据核心来对全部理论数据进行预测,结果将更加可靠。我们发现,实验数据核心能够对新的干涉实验结果进行可靠的预测。因此,基于这些数据核心,我们预测了所有理论数据。在此基础上,我们通过逻辑化简,最终获得了决定MIEP保持高活性状态的顺式调控逻辑。我们的工作至少在以下两点具有意义,(1)我们的工作表明,尽管只获得很少量的实验数据,但是只要保证并检测到数据具有冗余性,那么我们就可以做出接近正确的预测;(2)我们计算出两种位点参与的顺式调控逻辑,这个结果将会为以后的研究工作提供一些有用的信息,例如,根据调控逻辑,我们可以对MIEP进行改造,使改造的MIEP具有更高的活性,同样,我们也可以根据控制逻辑,找到控制病毒复制的根本原因。更进一步地,当我们结合顺反两方面的结果时,对于转录控制的本质的理解将会有一个飞跃性的进展。