从辞书数据建模到辞书辅助编纂

来源 :第七届(2009)两岸三院信息技术与应用交流研讨会 | 被引量 : 0次 | 上传用户:kill5678
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文以词典数据库的建立和管理、以及词条结构定制为例,介绍辞书数据结构模式(XML Schema)在辞书辅助编纂系统中的应用。在辞书辅助编纂系统的任务流程中需要多部词典参与,词典是这个系统最基本的数据资源。文本形式的词典是一种用非结构化形式表现的、具有半结构化特征的语言数据。为了能够系统地组织并完整地描述词典中语言数据的表现形式和其中蕴涵的语言知识。我们在辞书数据结构模式(XML Schema)框架下,对词典文本进行词条结构标注,再把文本形式的词典转换成XML文档,在非关系型嵌入式数据库Berkeley_DB XML平台为几部现有词典建立了数据库,供辞书辅助编纂过程中用作参照。对于新编词典数据库,也要先在辞书数据结构模式的支持下定制词条结构,编纂系统会根据定制了的词条结构生成新编词典数据库的数据结构、生成管理和访问在编词典数据库的辅助数据表,同时还生成在前台供编者使用的编写操作界面、数据显示格式和数据保存格式。在编纂系统里,可以用同样的方法同时创建几部新的在编词典。各部在编词典数据库,连同已有的参照词典数据库,都在辞书数据结构模式的支持下统一管理,用统一的操作进行访问。
其他文献
社会科学研究领域的师承关系是一类重要信息。为了解师承关系对社会科学研究活动的影响状况,结合特定领域的学术特点和关系特点,构建该领域的具有特定师承关系的人物关系网络,应
刘少奇一生有过6次婚姻,有的是奉了父母之命,有的是受组织撮合,能真正称得上革命伴侣的只有两位——何宝珍与王光美。然而,何宝珍为了革命事业过早地牺牲了,王光美则陪伴他走
数据的存储与处理在科学研究中的地位越来越重要。高效、绿色、可靠的存储环境是科研活动的基础要素之一。本文介绍了中国科学院数据中心的建设情况。针对不同科研单位各自科
在历史研究的领域中,「个人到社会关系」是很重要的焦点核心,提供了历史研究的多元切入点。从个人到社群,从姓名到身份地位,从人生价值到生命功过,这些资讯不仅谱写了过往的历史,也
会议
伟大的国际主义战士、加拿大著名外科医生白求恩,因为在中国抗日战争时期援华,于前线救治八路军伤员感染丹毒而光荣献身。毛泽东当时专为他撰写和发表了一篇《纪念白求恩》
世界各国都十分重视儿童的生存与发展问题。近年来 ,我国局部地区存在儿童男女性别比例失衡 ,在医疗保健方面 ,女孩应享有的权益未充分得到保障 ,因而引起社会广泛关注。为了
「国家型数位典藏计画」─「语言典藏计画」始於2001年;共五个汉语与台湾南岛语的数位化典藏子计画。数位化的内容有甲骨金文简牍,近代汉语文献,现代汉语文献,现代汉语语音,台湾闽
会议
常吃香蕉———香蕉含有丰富的维他命A、B、C、E和铁质 ,还含有协调身体酸碱度平衡的磷和矿物质 ,是提神醒脑的最佳保健食品之一。喝杯牛奶———牛奶中含有高度的钙质 ,且颇有营
本文介绍我们在研制辞书辅助编纂系统的过程中,用数据库软件管理辞书内容和语料的实验与探讨。以往的辞书数字化工作大多是把词典做成二维表,再用关系型数据库来处理。我们选择
会议
随着多媒体技术的不断发展,多媒体文件越来越多,如何管理、开发和利用好这方面的资料,使展示变得更加方便快捷,是数据库建设的一个主要内容。多媒体数据库就是通过对图像、语音、