【摘 要】
:
现代社会快速发展的同时也带给人们巨大的精神压力。随着医学的进步,精神类疾病逐渐被人们所重视。其中,精神分裂症作为具有遗传性的一种精神类疾病,因其病因不明,临床表现复杂而受到研究者们的关注。随着机器学习和基因测序等相关技术的大热,众多研究者将重点转移到机器学习的相关方法和生物医学中的组学数据相结合,进而得到研究者们所需的信息。本文采用的基于网络结构的多组学数据融合关联分析算法对fMRI数据(func
论文部分内容阅读
现代社会快速发展的同时也带给人们巨大的精神压力。随着医学的进步,精神类疾病逐渐被人们所重视。其中,精神分裂症作为具有遗传性的一种精神类疾病,因其病因不明,临床表现复杂而受到研究者们的关注。随着机器学习和基因测序等相关技术的大热,众多研究者将重点转移到机器学习的相关方法和生物医学中的组学数据相结合,进而得到研究者们所需的信息。本文采用的基于网络结构的多组学数据融合关联分析算法对fMRI数据(functional Magnetic Resonance Imaging,功能性磁共振成像)、SNP(Single Nucleotide Polymorphism,单核苷酸多态性)、DNA-methy(DNA methylation,DNA甲基化)这三类组学数据进行计算分析。首先,在对数据标准化等预处理之后,我们构建网络结构模型对样本数据进行一个结构的建模,针对每一类数据都建立相应的相似性矩阵,然后利用以交叉扩散过程为核心算法对样本对进行加强强相关,减弱弱相关的操作,将每一类数据融合成最终的统一数据矩阵,从这个统一矩阵元素中选择出强相关的样本对,进而对其进行具体关联的分析,最终根据对应的SNP位点、fRMI体素信息等找到潜在的精神分裂症的生物标识物和其相关例如潜在发病脑区等信息。相比于其他使用线性融合等的方法,本文采取的是非线性信息融合的方法,对先验信息要求低,并且不需要对每一类数据做权重的分配。通过模拟数据集和真实数据集的验证,在相同的参数条件下,三类组学数据的大部分融合样本相似度比两类组学数据相应的融合样本相似度高,并且在寻找相关疾病的潜在发病生物标识物时,三类组学数据最终分析结果比两类组学数据分析结果多,侧面论证第三类组学数据的加入对数据的融合有一定的补充和完善,从而在医学上分析相关疾病提供一定的帮助。
其他文献
<正> 云南是世界茶树的原产地,是世界茶树资源的宝库,具有极适宜茶树生长的自然环境。茶叶历来是云南省经济资源的一大优势,它对振兴云南经济,满足人民生活需要,发展对外贸易
性行为是动物中最重要的一种社会互动。尽管目前科学家对人类性向的生物学基础还所知甚少,对于动物性偏好的基因研究却已取得了不小的进展。
根据最小二乘准则或其他准则解算参数的最优估值时,需要已知观测值的随机模型.随机模型正确与否将影响参数估值,因此,快速高精度GPS定位需要已知正确的随机模型.采用GPS短基
目的探讨不同剂量瑞舒伐他汀对老年不稳定型心绞痛(UAP)患者血清同型半胱氨酸(Hcy)及高敏C-反应蛋白(hs-CRP)水平的影响。方法选择102例诊断明确的UAP老年患者,随机分为低剂
杨振宁的科技与教育思想可以概括为:科技发展有赖于教育的薪火相传;科技教育 要面向世界科技前沿,同时搞好科普教育;做好科技与教育的接口:研究生教育;专业体制 要适合科技发展,太专
张恨水是"鸳鸯蝴蝶派"的代表作家之一,"红颜薄命"则是他笔下千千万万个女性形象的共同写照,本文具体从悲情主义,女性自身的悲哀,以及女性的社会地位这三个论点着手,通过对其
隐性课程建设在大学英语教学中起着重要作用,而教师在隐性课程的实施中扮演着关键性的角色。本文针对我院教师在大学英语隐性课程设置及理解中存在的问题,提出了三项改进措施
目的:探讨师生双向评价反馈方法在新生儿科护理带教中的应用效果。方法:对83名新生儿科本科实习护生师生双向评价反馈方法,收集来自教与学双方的反馈,进行分析,并将分析结果作
在确定了最佳工艺条件的基础上,根据质量守恒原理,建立了基于微分床萃取的超临界流体萃取动力学模型,从理论上分析了超临界流体萃取过程中各因素对提取率的影响情况,并对模型中的