面向计算的现代汉语明喻句的考察

被引量 : 4次 | 上传用户:kevinlpr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
隐喻是人类赖以生存的认知方式和思维方式,对于揭示认知机制具有重大意义。然而,由于隐喻的多样性、隐藏性,隐喻理论的局限性,隐喻的计算化研究一直困难重重。现代隐喻学认为,从隐喻的表现形式分类,隐喻可以分为显性隐喻(明喻)与隐性隐喻,明喻是隐喻中的一种重要形式。现代汉语明喻句的典型句式为“A像B”,点明本体、喻词和喻体。正是由于明喻这种显性特点,大胆结合概念整合理论,可尝试通过计算的方式对明喻的认知机制进行探索。本文第一部分比较了两大隐喻理论:概念隐喻理论和概念整合理论,厘清二者最大的区别在于言外之意的获得。这是概念隐喻理论的局限,也是概念整合理论的发展。二者之间有继承有发展。相较于概念隐喻理论,概念整合理论主要突出了自身体验、自身知识库对于理解的关键作用。本文第二部分选择喻词为“像”的现代汉语明喻句作为研究对象,基于我们以前构建的认知属性语料库(从网上提取的“A像B一样C”的句式,规模为100万句),人工筛选出2110明喻句,标注出明喻句的本体、喻词、喻体和喻底,构建了一个现代汉语明喻语料库,为本文研究提供语料库基础。本文第三部分中,基于语料库做了统计分析。发现替代型的明喻句最多,达到1042句,占49.4%;比喻模式中以“本体—喻词—喻体—喻底”的明喻句有830句,占了39.3%,除此之外还有16种比喻模式。统计比喻成分的长度之后发现,各比喻成分的长度主要集中在6个词以内,各成分长度大于10的情况总体而言较少。本文第四部分,运用概念整合理论中的四空间模型详细解释了两种明喻句——喻底显示型明喻句和喻底隐藏型但能被理解的明喻句,简略解释了喻底同样隐藏但是不能被很好理解的明喻句。在解释时,首次尝试结合我们之前建立的认知属性库中的数据,以数据佐证三种明喻句或被理解或不被理解的原因。被理解或者不被理解,主要取决于当整合空间里发生层创作用时能否将我们自身的体验与认知新事物联系起来,若能联系起来则能够被理解,反之则不能。最后,利用条件随机场(CRFs)模型对像型明喻句的本体、喻体、喻底、喻词进行识别。选择适宜的标注集,选择适当特征模板,添加另外一些语言特征帮助识别,例如词性等。实验证明,在突出“像……一样……”标记作用之后,正确率、召回率和F值都明显提升。效果最优的模板是7w+7p’+3wp’(词语窗长为7,词性窗长也为7,3个词语与3个词性同时共现),F值达到76.11%。
其他文献
<正>神经系统损伤与再生修复的研究是当今神经科学领域的热点。随着成体神经干细胞的发现、材料技术和细胞培养技术的发展,组织工程学方法为神经损伤的治疗带来了希望。组织
会议
魏书生是当代语文教育领域的先锋人物,他的教育理论是当代语文教师的重要研究内容。研究人员试图从不同的角度将他的成功经验推而广之。但事实上,语文教师学习魏书生成功的经验
本文主要是以及物性衔接,人际意义衔接,以及主述位推进衔接理论为依据,对商业文体之一,董事长兼首席执行官年度致股东信的语篇进行分析(以索尼公司2012年和2013年致股东信为
众所周知,校园是学生读书求学的最佳场所。每天学生走进校园进入教室,传来一阵阵朗朗的读书声,不由得心生慰藉。可是,在这个计算机技术不断增进的时代,学生们更多的是在用高
本文主要开发了一种新型Cr-Pd膜合金电镀工艺,通过正交试验等方法确定了镀液配方中的主盐的络合剂、缓冲剂、阳极去极化剂、润湿剂等的选择和用量,利用电镀过程中的电流效率
摩擦学是研究相对运动的物体表面间的摩擦、润滑和磨损,以及三者间相互关系基础理论和实践(包括设计和计算、润滑材料和方法、摩擦材料和表面状态以及摩擦故障诊断、监测和预
当前,我国正处在由社会变迁引发的价值冲突和困境中。尽管当前我国德育取得了长足发展,但仍存在着许多棘手的问题。一方面,德育严重受到理性话语的支配,诗意审美发展视角缺失
术中冷冻切片诊断是病理科的一项高风险工作,时间紧、责任大.病理技师要在最短时间内制出切片,同时病理医师需要在最短的时间内做出正确的冷冻病理诊断,为临床医师确定手术范
用响应面法优化胶质芽孢杆菌胞外多糖的提取条件,探讨温度、pH值、转速、接种量对多糖产率的影响。结果表明,胶质芽孢杆菌多糖产率的最佳发酵条件为:温度34℃,pH值7.5,转速220r/min,
人民银行职能转换后,基层行在体制、机制等方面的建设,还存在一定的问题,影响货币信贷政策的贯彻执行,亟待改进和加强。