面向垂直领域的跨语言自动问答系统关键技术的研究与应用

来源 :河北科技大学 | 被引量 : 0次 | 上传用户:joy2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
垂直问答系统作为信息查询的方式,在各个领域中发挥着越来越重要的作用,但由于现如今的垂直问答系统多为单一语种,针对不同语种的人需要另行构建相应的问答系统,如果借助同一问答体系对使用不同语种人员进行服务,将会在很大程度上减轻构建系统的工作量。因此,本文在特定的垂直领域内,对该垂直领域文本进行分析,旨在构建该垂直领域内的跨语言问答系统。对文本进行答案抽取,以及多对种语言之间翻译模型地构建是跨语言问答系统的前提。本文主要针对答案抽取、机器翻译以及二者相融合系统进行相关工作地研究。具体研究内容有以下几方面:1)提出了一种叠加注意力的卷积神经网络模型的方法。在构建答案抽取的模型过程中,采用两层注意力机制,分别对文本、问题进行特征提取,然后对特征进行融合,通过在垂直领域中对文本-问题、问题-文本的二次强化学习表示,增强上下文语境的联系,实验效果有了明显地提升。2)提出了一种垂直领域机器翻译模型的方法。本文在特定领域中,对文本进行了中-英、英-中翻译模型构建,提出了一种将神经网络模型和基于规则翻译相融合的方法。构建领域对齐语料和领域用户词典,在向量层以短语和词作为基础,采用长短期记忆网络和注意力机制构建神经网络模型;采用句法分析对问题进行解析、分类,构建一个基础的翻译规则库。通过将二者进行融合,完成机器翻译工作。3)提出了一种在垂直领域中基于知识图谱知识表示的方法。通过将该领域中的实体、属性及其关系提取出来,将每个实体、属性通过关系进行连接,采用三元组的方式构建了一个领域知识表示平台,通过该平台,对答案抽取和机器翻译模型进行融合,融合后的系统将作为该领域问答系统的最终模型。实验验证,本文提出的方法是有效的。基于卷积神经网络的叠加注意力模型进行答案抽取的EM和F1值分别能达到71.2和80.2分;基于神经网络与传统规则的翻译模型可以有效的对问题进行翻译;答案抽取和翻译模型融合后的问答系统对特定领域内的问题能够使用不同语言进行准确地回答。最后,对本文存在的不足及下一步的工作研究进行了说明。
其他文献
鉴于海外市场较早发展、市场相对成熟,因此许多初创型中国企业在面临融资渠道非常有限的情况下,纷纷赴海外市场上市,虽然国内企业实现海外融资,但国外投资者对国内企业商业模式和经营理念并不认可,再加上相对成熟的市场、做空机制的存在,制约这类企业再融资和可持续发展,导致大量中概股私有化退市回归境内资本市场,但其中不乏也存在继续留在海外市场的企业,如北京新东方教育科技(集团)有限公司在2006年9月赴美上市,
目的:探讨足背皮瓣修复手掌侧皮肤软组织缺损的临床疗效。方法2007年3月—2013年12月,对收治的7例重度手外伤致手掌侧皮肤软组织缺损患者采用游离足背皮瓣进行修复,其中3例为急
目的:总结采用足背游离皮瓣移植修复颌面部皮肤软组织缺损的临床疗效。方法2008年8月-2010年6月,对8例颌面部肿物切除术后及外伤致皮肤软组织缺损患者,采用带腓浅神经的足背游离
一、对三间房站的安全管理潜在困难分析三间房车站是一个具有八十余年历史的老编组站.主要承担平齐、滨洲两大干线四个方向到发列车的中转解编任务。是全路路网中的区域性编组