基于知识元信息技术的中医古籍元数据研究

被引量 : 0次 | 上传用户:hmlsuper
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为中医学知识主要载体的中医古籍,从古至今一直是传统医学传承、创新、发展的源头活水。对中医古籍进行整理研究,是符合传统医学继承发展自身规律与需求的重要方法。中医古籍整理虽然难以确言其起始年代,但可以肯定的是,自中医文献大量出现后,随之而来的便是对这些文献的整理研究。如西汉成帝年间侍医李柱国校方技,北宋嘉佑年间校正医书局林亿等校正医书。中医古籍得以流传,正是得益于历代学者对古籍的不断整理研究。然而客观上古籍收藏地点分散,加之年代湮远极易损坏,尤其是一些珍贵的孤本、善本,图书馆基于保护的目的,严格控制使用次数,致使大部分古籍不能被有效利用;主观上中医古籍的整理与研究方法,从版本考证、编目、校勘、训诂到专科研究,学者们在各个工作环节上依然沿用手工作业的方式,皓首穷经将大量时间和精力花在艰苦而繁琐的爬梳、翻检劳作中,却难免博精难兼,挂一漏万。传统的古籍整理手段以及知识获取方式已经远远不能满足当前中医学加速发展的需求。二十世纪末以来,以计算机和网络为代表的现代信息技术飞速发展,并越来越广泛的被应用到人文和社会科学领域。借助现代信息技术开展古籍整理工作,发端于上世纪70年代末的美国,随后我国的古籍数字化工作于80年代初起步。90年代后期至新世纪之初,古籍数字化进入了高速发展的时期。计算机在资料存储、整理、检索和利用等方面,以及网络在数据传输、资源共享等方面展现出巨大优势。中医古籍整理方式的现代化,古籍资源的数字化,解决了古籍载体和传播方式落后,整理研究、开发利用效率较低,其中蕴含的大量知识得到不到充分挖掘等问题。中医古籍数字化的发展,满足了现代社会人们对知识获取和利用的需求,极大地促进了中医学术的传承和发展。中医古籍数字化隶属于中医古籍整理的学术研究范畴。中医古籍数字化与传统的中医古籍整理相比,虽然在载体形式和工作方式上有所变化,但古籍数字化研究的对象依然是古籍,同样是以利用和保护古籍为目的,继承和发展了校雠学的方法与经验,一并肩负着传承学术的使命。由此可见,中医古籍数字化作为一种古籍整理研究与现代科学技术结合而孕育出的新方法、新技术,适应了时代的要求。它是中医古籍整理未来发展的大势所趋,也是中医古籍整理研究工作在数字时代的延续与发展。然而,与古籍数字化蓬勃发展形成鲜明对比的是,目前对于数字化的定位千差万别,发展水平参差不齐,高质量的成果还不多见,数字化古籍的可信度更是常常受到人们尤其是古籍文献专业研究人员的质疑;一些基础性问题,纠结于技术层面而长期得不到解决;数字化古籍的应用还主要集中在机械、粗放的全文检索阶段,距离广大研究人员所期待的“研究支持功能”还相差甚远。究其原因,是古籍数字化的理论研究相对薄弱。近三十年来,古籍数字化发展的得失使我们越来越清楚地认识到:技术是形式,技术的发展只是古籍数字化的基础和条件,深入、切实地理论研究和观念创新才是真正推动古籍整理发展的核心动力。古籍数字化发展的每一个阶段,都需要有相应的理论作为支撑和指导。前人在长期的文献整理研究实践中,积累了丰富的经验,总结出了一系列的理论与研究方法。传统文献学的研究方法,是实现对古文献理解、传播和利用的有效途径,是古籍数字化理论创新的源头活水。业师柳长华教授从文献研究、古籍整理的角度出发,创造性地提出了“基于知识元的中医古籍计算机知识表示方法”这一指导中医古籍资源深入开发的新理论。本文即是在此理论框架内,对中医古籍元数据进行了系统的研究。全文主要包括以下四部分内容:第一部分,通过对该理论产生的渊源与基础的探讨,进一步论证了古籍数字化隶属于古籍整理的学科实质;第二部分,梳理了该理论体系的形成和发展过程,重点介绍了知识元理论研究的新进展;第三部分,系统表述了中医古籍元数据规范体系,通过对中医古籍元数据的研究,构建了以知识元结构为标准的中医古籍元数据分类体系;第四部分,列举了六种类型的中医古籍知识元实例,示范了中医古籍语义元数据在知识元标引工作中的应用。1、“基于知识元的中医古籍计算机知识表示方法”的理论渊源与基础。任何理论都不可能凭空产生,古籍数字化相关理论也是在继承中得到发展的。探究理论产生的渊源与基础,能够加深我们对其核心实质的理解。(1)章句之学是对单位知识的划分与总结。对古籍进行的解析,切分知识元是“剖章析句”工作的延续;分析知识元、知识体的内容,提取元概念、体概念,利用元数据对知识元进行标引描述和管理,是“辨其章旨而标识之”工作的延续。(2)编制卡片是对一类知识的总结与管理。卡片的编制便于将大量文献资料进行系统地分类整理,层级编码和提取小标题等纸制时代知识管理的方式在数字化时代表现为知识元的聚类和知识体的层次现象。(3)分类是对知识体系的次序化。人类不断地创造和丰富着知识财富,又不断地要求对浩浩无涯的知识进行集结、序化和优化。否则,古今知识财富不可能被有效地利用。知识分类是我们寻求知识的出发点,它犹如学海的航标,既可为追求知识的人指明求学的门径,也可为从事知识管理的人提供理论指导,以便使纷繁复杂的知识得以依类分理、各有归属,从而建立起次序化、规范化、系统化的知识世界。古籍数字化研究的出发点就是实现中医古籍知识的分类系统化和管理可控化。(4)活字印刷是对知识的排列与组合。中医古籍所蕴涵的中医学知识是无穷尽的。但是我们认为,组成中医学知识的基元却是可穷尽的,不可穷尽的是知识基元不同地排列与组合方式。在业师柳长华教授构建的中医古籍知识库理论体系中,这种基元被称之为中医古籍的“知识元”。(5)元数据是知识管理的有效途径。元数据的应用,为网络信息资源的有序组织、适度控制和高效检索利用,提供了便利的条件。是目前国际公认的解决数字文献管理的有效途径。基于对知识元规范化描述的需要,我们将描述和管理资源的元数据理论应用于对中医古籍知识内容的描述和管理,构建了中医古籍语义元数据体系。2、知识元理论研究的新进展。(1)知识元的特性表现为:独立性、拓扑性、结构性、链接性、可控性。(2)知识体的特性表现为:构建性、开放性。(3)语义的特性表现为:领域性、表达性。(4)知识元结构定义:{名称、表示、法则、操作、导航、上属、相关)。(5)元概念与元数据的关系:中医古籍语义元数据为元概念提取的规范化而制定,是元概念规范化的基础。(6)知识元链接理论:知识元的链接是知识系统不断扩充,发展完善的基础。(7)知识元分类:在知识元标引课题的研究中,如何认识知识元并从什么地方切入研究,对知识元进行归类分析是进一步认识知识元的重要步骤。(8)中医古籍知识元归类分析:学科分类方式是知识体层面(例如:药、方、病证等)的分类,侧重于人类对知识的理解;知识元归类方式是知识元层面(例如:病证名、病因病机、功用主治、辨证等)的分类,侧重于计算机对知识的表示和管理。知识元理论的提出,使得知识的控制单位从文献这一层级深入到其中的数据、公式、事实、结论等最小的独立的知识元的层级。本文中医古籍知识元的归类,参照了温友奎先生的分类方式,按照知识元对象结构的相似度尝试将中医知识元分为:名称类、原理类、操作类、对比类、相关类、叙述类。3、中医古籍元数据规范体系构建。中医古籍是古籍形式和中医知识的统一体。一方面,作为古籍,它具备一般古籍的物理形态和古籍一般的结构体例;另一方面,“医籍,载医道之文也”,它所承载的是中医学的专业知识。基于此,我们制定了两大类型的中医古籍元数据:中医古籍元数据和中医语义元数据。中医古籍元数据用于古籍外部特征的描述与管理,中医语义元数据用于中医知识单元内容特征的描述。(1)中医古籍元数据分为:书目元数据、书体结构元数据、校勘元数据、注释元数据。(2)中医语义元数据分为:名称类元数据、原理类元数据、操作类元数据、对比类元数据、相关类元数据、叙述类元数据。在此分类体系下,参照北京大学图书馆《古籍描述元数据著录规则》的方式,对每一条元数据所应有的内涵和外延,以及使用过程中的细则作了说明和规范。可望为中医古籍知识库建设中的古籍解析标引工作提供更加规范化地指导。4、列举了六种类型的中医古籍知识元实例,示范了中医古籍语义元数据在知识元标引工作中的应用。
其他文献
本文旨在以跨文化本土性研究方法以济南大学生为例研究当今大学生的孝道观。孝道是中国传统道德中最基本、最重要的道德。“孝”这一概念一直是儒家伦理的基础和核心,是孔子
[目的]研究某院腰椎间盘突出症临床路径的实施效果。[方法]采用文献查阅、专家访谈及专家论证等方法设计腰椎间盘突出症MED术临床路径文本,并采用历史对照法对比分析实施前后
目前我国宏观调控的力度越来越大,建筑业正面临转型升级的关键时刻,要不断适应当前市场经济环境的变化,企业自身也要进行不断的改革。为了进一步促进建筑行业的稳定健康发展,
尽管止吐药的有效性和循证指南的可用性得到充分验证,但在接受化疗的癌症患者中,有高达30%仍未能达到恶心呕吐症状完全缓解的目标。本文对肿瘤患者化疗所致恶心呕吐的风险预
古代社会的“状”、“报”、“邸吏状”、“朝报”、“塘报”、“邸抄”、“牌报”等等通称邸报,它是我国古代官府传知朝政的文书抄本和政治情报。其内容主要包括皇帝的起居
<正>古往今来,道家对于"淡",可谓是情有独钟。倘若追根穷源,可上溯到先秦时期的道家学说创始人老子。《道德经》日:"道之出口,淡乎其无味。"《道德经》叉日:"恬淡为上。"道家
布鲁杆菌病(简称布病)是一种细菌性人畜共患传染病,是由布鲁杆菌引起的一种人畜共患的传染变态反应性疾病。本研究通过对2005~2015大同市上报布鲁杆菌病监测数据进行流行病学
在传播手段日新月异的信息时代,各种信息以人们无法想象的速度传播和交换,快速便捷的网络新闻于是应运而生,成为人们获取信息的重要来源,但是由于网络新闻题文分离的布局特点
汉字构形说在字本位的影响下运用而生,是探讨汉字教学的一种新理念,它从分析字形结构入手分析整个字的部件构成文化。文化是汉字构形的重要内容,它与汉字构形是相辅相成的关
金泽是日本北陆地区著名的历史文化名城,是近代日本最具代表性的以防御型城堡发展起来的城市之一,随着明治维新以来140年的文化遗产保护探索,积累了丰富的经验,保留下来众多的城