复杂疾病危险因素的统计分析方法

来源 :中国科学院数学与系统科学研究院 | 被引量 : 0次 | 上传用户:chenfurongyalan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
复杂疾病严重危害人类健康,其危险因素分析十分重要,是科学研究的前沿领域之一。本文主要讨论复杂疾病危险因素分析中的若干统计问题,包括:危险因素建模中的稳健的变量选择问题;遗传因素分析中基因间交互作用的识别问题;蛋白质相互作用网络的预测问题。本文的主要工作如下。   一、提出了在线性回归建模中含有离群点时的变量选择方法——稳健向后删除法。和已有方法相比,该方法的计算量较小,能用于分析大规模数据集。模拟结果和实例分析都表明,该方法能消除离群点对变量选择的影响,得到正确、稳定的结果。稳健向后删除法中识别诸子模型的离群点是基于本文提出的一种离群点识别方法——两阶段法。作为线性模型下的离群点识别方法,它能很大程度上克服掩盖和淹没效应。   二、改进了原有分析基因与数量性状间关联关系的CPM方法,即提出了寻找基因型最优划分的贪婪搜索算法,称之为GOP方法。CPM方法用穷举法寻找最优划分,只能分析基因间的二阶交互作用。GOP方法在保证足够精度的同时,大大减小了CPM方法的计算量,使之能分析基因间更高阶的交互作用。将该方法用于高血压数据分析,发现了关联的基因,其中包括三阶交互作用。   三、发现了具有协同进化关系的蛋白质组的正态性特征,并提出了识别蛋白质协同进化组的同源性聚类算法。该方法能预测蛋白质相互作用网络,并能给出判断蛋白质两两之间是否具有强相互作用的合理阈值。文献中原有的方法只能描述蛋白质两两间的相互作用,而且不能给出定量的判断准则。
其他文献
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
我们在Cn上的弱q-凸域上建立了关于(a)-方程的一个估计,由此推出其他形式的估计式,并得到了(a)-方程的存在性定理.我们同样在弱q-凸域上证明了Diederich-Fornaess型结论.  
车辆路径问题(Vehicle Routing Problem,简称VRP)在物流研究领域备受关注,已成为该领域的热门问题。合理的路径安排方案不仅可以降低企业的配送成本,还可以提升企业服务的质量。
在教育中我们不但要以激发学生潜能作为远大的教育目标,还要普及有关潜能的知识,让学生正确认识、了解自身潜能,消除学生对潜能的陌生感和神秘感,建立自我潜能开发的意识。在
塑料衬垫(简称塑衬)因其有绳槽利于钢丝绳的有序排列,并具有使用寿命长、成本低和更换相对方便等优点,在矿井提升机上得到了普遍推广。 Plastic lining (referred to as pla
本文首次提出了由Bootstrap方法寻找回归参数和模型误差的先验分布的反演方案.同时,对按照地物分类后的先验数据作统计假设检验,说明了将先验知识分类的合理性.最后,以核驱动模型R
在过去的半个多世纪,图论的飞速发展使得有限图备受关注,其研究成果不断涌现,近年来,无限图的研究也逐渐地引起人们的重视,原因之一是无限图的许多理论在数学的其它学科有着
快速、准确且稳定地求解线性和非线性代数方程是数值分析领域中的最基本问题之一。非线性矩阵方程出现在科学计算和工程应用的诸多领域,研究这类问题解的存在性与其它性质,以及
学位
为了提高高职院校学生应用数学解决问题的能力,切实把学生培养成技能型人才,依据教学实际情况,分析了目前教与学中存在的问题,制定了提高教学质量和学生应用能力的策略,包括
中煤会选字【2010】第01号中国煤炭学会选煤专业委员会、煤炭工业选煤情报中心站、《选煤技术》杂志拟于今年第3季度召开学术年会,现将有关本次会议征文要求及事项通知如下: