Hedge Trimmer句子压缩技术的算法实现及改进

来源 :沈阳师范大学学报:自然科学版 | 被引量 : 0次 | 上传用户:eire
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
压缩技术旨在模拟人类的文本概括和信息提取能力。句子压缩技术是自动生成能够保留原句核心内容的,合乎语法的,语义连贯的简短句子。文章分析了英文句子压缩技术中基于句法分析的Hedge Trimmer压缩技术,讨论了相关压缩理论,探索其压缩过程并用类C语言进行算法实现。提出了好的压缩句应该至少满足以下3个标准:第一是保留原句的核心内容,第二是具有正确的语法,第三是压缩长度合理。在算法的评估工作中,从DUC 2003语料库中选取了624个原始句子和对应的人工压缩句,与Hedge Trimmer压缩算法自动生成的压缩
其他文献
在建设国际旅游岛的背景下,海南的经济发展状况备受关注。本文从海南自身特点出发,选择了与该省经济发展关系最为密切的三个行业,即旅游业、房地行业和农业,以搜集到的22年的
由于泥浆的侵入,或是由于酸化,或是由于流体的注入,很容易导致井底附近由于不稳态表皮效应引起了渗流区渗透率或孔隙度突变,使得均质油藏变成复合油藏。考虑采用抽汲井作业及其抽
江陵凹陷构造演化经历2个构造旋回和1个构造定型期;第一构造旋回奠定了江陵凹陷的雏形,并清晰了构造格局,是研究区最主要的烃源岩发育期;第二构造旋回是构造活动的鼎盛期,不
在裂缝表征参数描述基本上,介绍了裂缝空间分布网络模型的建立的过程。在辽河油田沈229潜山实际的岩心、测井及岩性的空间分布规律研究基础上,建立了裂缝空间分布模型,认为裂缝