【摘 要】
:
近年来,自然语言研究的热点已经转到了语义角色标注上来。本文以汉语框架语义知识库为基础,结合汉语自身的特点,重点研究了汉语框架语义角色自动标注问题,为以后构建大规模的
论文部分内容阅读
近年来,自然语言研究的热点已经转到了语义角色标注上来。本文以汉语框架语义知识库为基础,结合汉语自身的特点,重点研究了汉语框架语义角色自动标注问题,为以后构建大规模的语料库,推动中文信息检索、自动问答、信息抽取等自然语言处理技术的发展,做出了有益的探索。由于汉语的完全句法分析器的性能达不到使用阶段,本文将汉语框架语义角色看做是以词为标注单位的序列标注问题,使用支持向量机作为分类器来训练模型,并将词层面特征和基本块层面特征融合到标注模型中。本文的语义角色标注任务为:给定目标词和目标词所属的框架,在句子中自动识别出框架元素并为其标上相应的框架语义角色。本文从汉语框架语义知识库中挑出25个框架作为实验语料,并在此实验语料上进行了3组2折交叉验证,最后用这3组2折交叉验证的均值作为我们模型的性能。实验中,我们首先为每类候选特征提供几种窗口大小,然后用正交表对特征及其窗口的大小进行选择。本文构建了两类语义角色标注模型:一类是基于词特征的语义角色标注,在把语义角色的识别和分类分开进行时,我们得到了59.65%的F值,把识别和分类联合起来进行实验时,我们得到的性能是58.72%;另一类是基于基本块特征的语义角色标注,在语义角色识别和分类分开进行时我们得到了59.67%的F值,识别和分类联合进行时得到了58.92%的F值。实验结果表明:(1)将语义角色标注分为两步进行比两步联合起来进行的性能要好;(2)加入基本块信息后,语义角色识别和分类的性能都有所提高,但提高不大;(3)两类模型都表现出了明显的高准确率低召回率的现象。
其他文献
设τ∈R-tors,U为左R-模,该文是在[5]和[2]neat同态的基础上引入τ-comeat同态,U-neat同态,τ-small模等概念;给出了它们的若干刻划;证明了τ-投射模与τ-coneat同态,τ-coet
随着人们生活水平的是益提高,一些富裕性疾病(高血压、冠心病、糖尿病、高血脂症、肥胖症的统称)的患病在中国正在呈逐年上升的趋势.为了更好地研究和预防这些疾病,1997-1998
该文引入了几类基于支撑树族,2-补支撑树族,2-补子图族和(K,K)-边连通支撑子图对族的变换图,并研究了这些变换图的一些结构属性.在第二章,研究者们引入了非邻接交换支撑树变
全局优化问题广泛见于图像处理、化学工程设计及控制、网络交通、分子生物学、金融、经济模型、数据库、环境工程学等.对于弱凹规划问题(目标函数为二次函数与凸函数的差)在
小波分析是近几年来发展起来的分析和处理信号的新工具,它继承了傅里叶分析的优点,而且在时域和频域同时具有良好的局部化功能.这使得它的应用及其广泛,而且取得了许多成果.
学习理论的目的在于指导实践。党的十六大以来,鄂尔多斯市委把改进各级党委中心组学习作为加强领导班子建设、提高决策水平的大事来抓,采取有效措施,使理论学习在推动地区改
该文分两章,第一章讨论三阶差分方程.工作人员对方程(E)的解给出两种情形下的定性分析结论,通过得到的对偶原则分析了(E)、(E)解的有关性质,将文[1-5]的结果推广到了差分方程
该文针对非线性方程组、等式约束优化问题提出了一种有效的算法,这种算法是精确牛顿步和几个带有预优广义共轭梯度法的不精确牛顿步的优化组合;预优矩阵恰好是最近一次精确牛
论文包括三章.第一章介绍一些背景知识,主要结果包括两部分,即第二章和第三章.主要对同类机在特定条件下极小化最大完工时间的排序问题进行研究.
该文研究医学图象的可视化,是八五项目"IUD主要副作用发生机制及其防治方法研究"课题中子宫内膜螺旋动脉的表面三维重建部分.表面三维重建,一般包括图象定位、表面重建和三维