论文部分内容阅读
随着“奥巴马”脑计划、欧盟十年脑计划的启动,脑科学已成为当前的研究热点,而有效的脑大数据管理和利用也是脑科学研究的必然要求和各类脑计划的重要研究内容。对于以人类高级认知功能研究为核心的脑信息学,相关研究则聚焦于直接反应了人类认知功能的信息加工过程的脑功能数据。进而,由于系统化的研究方法,脑信息学对脑功能数据的管理要求并不局限于有效的数据存储和共享。对收集的脑功能数据信息进行整理,以适当的认知功能层次、脑区层次等进行组织,有效响应人或智能Agent的多侧面的、不同层次的数据请求,以及支持数据共享和系统化的脑数据分析等都成为脑信息学系统化脑数据管理的核心内容。 上述系统化脑数据管理的实现是建立在脑功能数据的描述之上,包括对数据本身、数据间的关系、数据的生成、数据的演化、数据内容等的全面描述,以及数据描述的有效组织、表达、存储和操作等。事实上,这样的数据描述所需要的不仅仅是数据建模或者数据库建模,而是对系统化脑信息学研究全过程的建模。现有的脑数据库和元数据其构建方法难以满足这样的需求。因此,脑信息学研究者需要研究脑信息源,探索新的脑功能数据元数据构建方法以及应用技术。 本文以脑信息学为领域背景,以系统化的脑数据管理为目标,针对现有的脑数据管理技术难以详细描述脑数据的起源和过程信息这一问题,对脑信息源的模型、构建脑信息源进行研究,并且在此基础上,搭建了语义技术的脑信息源知识服务平台,从而对脑信息源的应用研究展开论述。 建立脑信息源模型是脑信息源研究的前提。为了支持系统化的脑数据管理,从脑信息源模型建模的研究动机出发,给出了脑信息源模型的基本元素、扩展元素及其元素间的关系。并且为了满足系统化脑数据管理的需求,以经典的开放性源模型为理论基础,不同于传统意义上的开放性源模型,形成了脑信息源模型。根据脑信息源的特点,分别设计了脑信息数据源概念框架和脑信息分析源的概念框架。同时,为了便于脑信息源的存储和表达,明确了脑信息源的组织结构和主要运算,给出了脑信息源的逻辑模型,较为详细的描述了脑信息源组成及其建模过程。 脑信息源构建是系统化脑数据管理研究中的核心问题。它不仅要实现面向数据存储和数据共享的管理,而且还要实现面向系统化脑数据分析的管理。本文在脑信息源模型的建立基础之上,需要对脑信息源模型的内容进行填充。并且,为了构建脑信息源,已有的内部知识源已经不足以支持当前的大数据量,继而需要从大量的生物医学文献资源中进行信息的获取并且填充到脑信息源数据中去。脑信息源的构建前提就转换为数据脑驱动的文档选取的预处理问题,随后以解决该核心问题为出发点,讨论了脑信息源的特点以及数据脑驱动的文档级别判定方法,为实现脑信息源的构建提供了理论前提和技术基础。随后基于已经建立的脑信息源模型,明确了脑信息源知识的识别与获取。最后,对获取的脑信息源内容进行知识库构建,完成了脑信息源构建的整体全过程。 脑信息源的应用研究是脑信息源的一个重要侧面,它是为满足系统化脑数据管理需求的一个应用拓展方面。本文在建立脑信息源模型和构建脑信息源的基础之上,实现了一个基于语义技术的脑信息源知识服务原型系统,在此系统基础之上,研究了脑信息源某个侧面和多个侧面的推荐方式。在脑信息源某个侧面的推荐研究中,明确了基于作者和共同作者的脑信息源话题兴趣推荐模型,从而为对脑信息源感兴趣的研究人员提供了有效服务和支持。同时,通过测量脑信息源多侧面的研究兴趣,基于搜索和推理的融合来做推荐,提高文献搜索的准确率。基于脑信息源知识服务原型系统,来为对脑信息源感兴趣的用户或研究人员做应用研究的探索。 本文的主要创新点概括如下: 1)提出脑信息源模型,针对脑信息学的领域特点和需求,扩展开放性源模型,形成一个从概念模型到逻辑模型的脑信息学系统化研究建模方法。明确了脑信息源的定义、范围、内容结构,为脑信息源的构建和应用研究奠定基础。 2)设计了领域知识驱动的脑信息源文档选取策略,将数据脑所包含的领域知识融入文档建模和评估,设计了全新的概念、属性和关系特征,有效地实现了文档筛选,解决了脑信息源自动构建的关键问题,使得脑信息源的内容识别和抽取仅依靠自定义规则就能完成。 3)提出了脑信息源话题的作者和共同作者兴趣推荐模型,并在此基础上,结合脑信息源多侧面兴趣点,通过测量研究兴趣,开发了搜索推理融合的研究推荐技术,有效提高领域文献搜索的准确率,满足系统化脑信息学研究对知识检索的需求。