面向古代汉语的句本位句法分析研究

被引量 : 0次 | 上传用户:cutuf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中国悠久辉煌的历史,孕育了中华深厚文化内涵,而古代汉语作为传承中国文化的主要载体,是学习、研究中华灿烂历史文明中不可忽视的重要媒介。得益于信息技术的蓬勃发展和在语言学领域的积极应用,语言学研究也迎来了新的时期。但在信息科学日新月异的同时,古代汉语的信息处理研究却明显滞后。  句法体系及其分析是自然语言处理领域的一个难点,在自然语言理解、自然语言生成、机器翻译等应用领域均有着重要的研究价值。同时,句法也是语言习得的重中之重。目前自动句法分析所得到的数据结构虽然便于机器读解,但对于人来说,难免晦涩难懂。  本文调查研究了当前中文信息处理领域句法分析的研究现状,评价了各句法体系的优缺点及可靠性,以黎锦熙先生在《新著国语文法》中提出的“句本位”句法体系为蓝本,以面向古代汉语的句本位句法体系机器自动分析为目的,欲探索一种新的中文信息处理句法体系理论框架。句本位图解法可以清晰体现句子结构这一优势,将为古代汉语研究者提供一种理清文义的便捷手段。句本位句法应用于古代汉语的研究,无论是对于推进中文信息处理领域句法分析的发展,还是对于为古代汉语学习及研究者提供一种有助于古代汉语习得、品味的途径,未尝不是一种崭新的思路。  本文主要包括古代汉语句本位句法体系的设计和句法树库的建立(资源篇,第2-3节)、自动句法分析的研究(理论篇,第4节)及句法分析器的开发(应用篇,第5节)三个方面的内容,是从语料处理到核心理论研究,再到应用实现的一整套系统化过程。  1.体系的设计和句法树库的建立  选取中国台湾中央研究院《论语》标注语料库为研究对象,对其进行切句、词性抽象化等预处理,并对句子进行句本位句法树人工标注,建立句本位句法树库;  2.自动句法分析研究  采用分词、词性标注后,通过词性序列与句法结构匹配,对分词、词性标注结果进行优选的方法进行句法分析;  3.句法分析器的开发  采用.Net多层架构设计,在Microsoft Visual Studio2010平台上进行开发,以图解的方式生成输入语句的句法树。在《论语》的封闭语料内以及与《论语》语言特征类似的语句上进行测试,结果是令人满意的。
其他文献
随着Internet的流行和发展,人们对于Internet的依赖也越来越强,对Web应用也有了更多的需求。传统Web应用的客户端主要是用来渲染服务端返回的HTML页面,功能单一,难以满足用户的交
互联网的蓬勃发展使距离不再成为人们认识彼此、交流信息的障碍,基于地域、爱好和理想等多种元素交汇的网络社区逐渐成为人们更加方便地获取信息的手段。虚拟的网络社区延续并
随着互联网技术的迅速发展和普及,尤其是社交网站和图像共享网站的不断推广和应用,网络上的图像数量呈现快速增长趋势。如何快速、准确地从海量的图像数据中检索到用户所需要
在计算环境从静态、封闭、可控逐步走向动态、开放、难控的过程中,软件呈现出一种新的形态——网构软件。网构软件的开放性给其服务质量的保障带来深层次的技术挑战。首先,网
粒计算是研究如何在问题求解过程中使用人类“粒度”和“粒”的思想的一门新兴学科,致力于探索基于粒度的理论、技术和工具,在过去十年中,它得到了很多研究者的关注。粒计算三元
随着移动技术的发展,智能手机等移动设备在日常生活中起到越来越重要的作用,但受限的资源始终制约着智能手机的计算能力。为了扩展移动设备的计算能力,弹性计算的概念被应用
约束满足问题(ConstraintSatisfactionProblem,简称CSP)简而言之就是由一组变量和一组约束组成的约束关系,求解约束满足问题就要为变量找到一组赋值而并不违反任何一个约束。
定位技术指的是运用某种无线通信网络平台,将收到的无线电波的某些参数如信号强度转化为定位节点与参考节点之间的距离,然后按照特定方法测得移动终端在某时段内所处的地理位置
中国互联网络信息中心(CNNIC)发布的近几年的《中国搜索引擎市场研究报告》中指出,网络音乐以其使用率一直位居中国互联网应用前三甲,大部分综合搜索引擎都已经提供针对音乐
音乐曲风与情感自动识别是音乐检索与推荐领域的重要课题。相较于元信息、歌词、标签等文本数据,数字音频本身是音乐最直接、客观的数据来源。当今大多数现有的音乐自动分类