医学文献中药物与疾病关系的抽取与分析——以阿司匹林和顺铂为例

来源 :中国医科大学 | 被引量 : 0次 | 上传用户：a2009090720

【摘要】

：

目的：　　生物医学研究的快速发展以及电子型数据的出现，使人们陷入了数据的海洋之中，这成为人们探索生物医学实体之间关系的瓶颈。同时，在临床上，药物不良反应导致的死亡和用药

【作者】

：

吴明智

【机构】

：

中国医科大学

【出处】

：

中国医科大学

【发表日期】

：

2010年期

【关键词】

：

医学文献生物医学实体关系抽取文本挖掘

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

目的：　　生物医学研究的快速发展以及电子型数据的出现，使人们陷入了数据的海洋之中，这成为人们探索生物医学实体之间关系的瓶颈。同时，在临床上，药物不良反应导致的死亡和用药不当导致的住院和门诊费急剧升高也成为临床安全合理用药面临的主要问题。本研究以Mubaid的基于统计的文本挖掘方法为基础，经过适当的调整后，将其应用于抽取阿司匹林和顺铂与疾病类实体之间的关系，验证Mubaid的研究方法是否能够应用于这一领域，并期望从生物医学文献中提取出有价值的药物的不良反应的信息，从而有效的预警药害事件，为临床安全合理用药提供技术参考，进而更好地维护公众健康。　　方法：　　本研究以Mubaid基于统计的文本挖掘方法为基础，利用理论值、实际值和Z评分等参数计算各种疾病类概念在药物副作用文献中出现的统计显著性，从而挖掘出有显著意义的疾病与药物副作用概念间的共现。具体做法为从PubMed数据库检索阿司匹林和顺铂的副作用的文献为研究组，分别统计文献集合中疾病类概念的出现频次，同时分别设立排除了研究主题内容（阿司匹林和顺铂）和排除了研究主题上位类主题词内容（水杨酸类、氯化合物、氮化合物和铂化合物）的文献集合作为基准组，用于比较疾病类概念在研究组和基准组中的差异程度。为了区分从不同字段抽取信息的效果，采用主题词字段分析和自然语言分析两条技术路线，即同一基准组，用基于文献频率和基于词汇频率两种参数计算方法，计算某个生物医学实体概念在研究组文献中出现的理论值、实际值和Z评分，比较该词在研究组文献和基准组文献中出现频次的差异。为了评价研究方法的抽取效果，对Z分值较高和只在研究组文献中出现的概念进行分析，判断哪些概念是权威网站，药典、教科书和药品说明书中已经认定的阿司匹林和顺铂的治疗应用以及能够导致的不良反应。对没有涵盖在内的疾病概念，通过阅读文献确定它们的药物作用。用受试者工作特征曲线分别比较阿司匹林和顺铂不同的基准组以及同一基准组不同参数计算方法在生物医学实体关系抽取结果上存在的差异。　　结果：　　阿司匹林两个基准组中新抽取的治疗应用和不良反应的发现率为36.6％和36.7％（48/131，47/128）。顺铂两个基准组中新关系的发现率均为51.1％（68/133，69/135）。卡方检验显示基准组挖掘结果之间没有差异；不同的参数计算方法对阿司匹林和顺铂的抽取结果存在差异，说明研究方法具有领域特异性。从各组只在研究组中出现的概念中抽取出新关系的比例分别为40.43％、47.83％、59.57％和56.82％。受试者工作特征曲线分析显示，阿司匹林研究组第一基准组结果优于第二基准组结果，基于文献频率的参数计算结果优于基于词汇频率的参数计算结果；顺铂两个基准组以及同一基准组不同参数计算方法之间的比较结果均不一致，但各比较组间均没有显著的统计差异。　　结论：　　本研究通过基于共现统计的文本挖掘方法抽取出了阿司匹林和顺铂与疾病类生物医学实体之间的关系，证实了Mubaid的挖掘方法能够用于这一领域，并且能够提取出权威网站、药典、教科书和药品说明书中没有涉及到的阿司匹林和顺铂的治疗应用以及能够导致的不良反应，得到了有价值的并能够用于指导临床安全合理用药的药物警戒信息。

其他文献

基于用户兴趣的P2P搜索机制研究

P2P网络技术的发展和网络资源的增长不仅给用户在搜索、定位和获取信息资源上带来了巨大的困难,也越来越无法满足用户的个性化需求。基于P2P搜索引擎的搜索范围理论上将包括

学位

P2P用户兴趣个性化搜索引擎查询扩展

面向农业领域知识库构建的数据清洗方法优化研究

大数据时代,数据的意义在于对其进行专业化处理。数据质量成为数据挖掘、专家决策、商业智能等活动成功的关键。但是,迅速膨胀并变大的数据量妨碍了清洗数据的效率,使得漫长

学位

农业领域知识库数据清洗数据匹配框架流程

图书馆危机管理的沟通机制研究

近年来，危机事件频繁发生，使人们逐渐认识到了危机管理的必要性与重要性，危机管理逐渐成为社会各组织的必修课。现代图书馆作为社会组织的成员之一，也必须面对许多由于内外部环境

学位

图书馆危机管理沟通机制

基于Logistic回归的水利工程边坡定性评价

水利工程建设中因场地的限制,往往需要对山体进行开挖和填补,因此自然边坡和人工开挖边坡的稳定性是影响工程质量的关键因素.在可行性研究阶段,进行简单可行的坡体稳定性评价

期刊

水利工程边坡稳定性Logistic回归

红外光谱数据库系统研究

随着在信息处理方面的新技术的不断发展,在对红外光谱数据进行深度加工的基础上,国内外都发展了信息更加浓缩、知识性更强的红外光谱数据分析系统。上海化学有机所计算机化学

学位

红外光谱数据库红外光谱检索红外光谱数据库管理

企业知识管理理论研究——基于过程的视角

自20世纪90年代被提出以来，知识管理受到越来越多的学者和实践者的关注。现在，如何构建一个完整的知识管理理论以及如何把知识管理作为一个单独的学科来建设已经成为至关重要的

学位

现代企业知识管理企业战略竞争情报

高校图书馆电子资源服务绩效评价研究——以天津商业大学图书馆为例

电子资源在当今图书馆馆藏中的作用日渐凸显，尤其是高校图书馆的电子资源已经成为全校师生教学和科研必不可少的重要学术资源之一。据相关统计显示，目前我国大中型高校每年用于

学位

高校图书馆电子资源服务绩效评价指标体系

基于国际视角的公立科研机构绩效评估框架体系研究

公立科研机构是国家创新体系的重要组成部分，是促进国家科技、经济和社会发展、保障国防安全的重要力量。20世纪90年代以来，随着私营部门绩效管理思想在西方国家政府部门和公共

学位

公立科研机构绩效评估功能定位管理模式

科技项目小同行评审专家识别研究

针对目前科技项目管理工作中存在的难以识别发现真正的“小同行”评审专家的问题，满足科研管理部门对筛选熟悉项目研究主题的小同行评审专家的实际需求，对国内外专家识别方法进

学位

科技项目专家识别学术论文空间向量相似性计算

4.1～4.30中国药店官微图文页阅读人数排行

请下载后查看，本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.

期刊

中国药店一心堂老百姓大药房电子监管码执业药师百强榜直营连锁市值保健品晚餐

医学文献中药物与疾病关系的抽取与分析——以阿司匹林和顺铂为例

其他学术论文