基于语义空间距离的相似问句识别方法研究

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:huangwei0541
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
前沿相关研究将相似问句识别转化为二元问句匹配识别并取得很大进展.但是在自动问答系统的实际应用场景中存在大量数据,这些方法受限于二元问句匹配识别模式,导致时效性不高.针对这一问题,受人脸识别相关研究的启发,该文提出基于语义空间距离衡量的相似问句识别方法(Semantic Space Distance Method,SSDM).该方法将相似问句识别作为多分类问题进行训练,通过利用人脸识别任务中Margin Softmax损失函数得到语义编码模型.该语义编码模型能够将相似问句在语义空间中聚合,不相似问句在语义空间中远离.SSDM方法将相似问句识别转化成语义空间中的向量距离计算,突破二元问句 匹配的方式,保证了一定的高时效性,并且仍然能够在深层语义层面对相似问句进行识别.该方法在Biendata的ASQD数据集中实验测试,取得了比基线方法更优的性能,验证了 SSDM方法的有效性.
其他文献
道路雨水井盖系统作为重要的市政设施经常会在雨天发生堵塞,而现有清淤方式效率不高.基于此我们运用TRIZ理论设计了一种新型雨水井盖系统,避免堵塞的同时优化了环卫工人作业流程.本文运用TRIZ理论中的功能模型和因果分析找到问题的关键点,再运用矛盾分析得到最终方案.
本试验旨在探究多肽添加水平对刺参生长性能、免疫及肠道功能基因表达的影响.试验选择300头刺参[体重(34.40±0.23)g)],根据不同多肽添加水平(0、5%、10%、15%、20%),分为5组(D1、D2、D3、D4、D5组),每组3个重复,每个重复20头刺参,探讨多肽对生长性能及肠道功能基因(腱生蛋白、胶原蛋白α2、整合素αV、整合素βL、p105、p50、rel和lys)表达的影响.试验期60 d.结果表明:D4组的刺参特定生长率(SGR)显著高于其他组(P0.05),较D1组降低了25%.体腔液
本试验旨在研究香芹酚对肉兔生长性能、养分表观消化率、肠道消化酶活性、免疫器官发育及抗氧化能力的影响.选取120只35日龄体重相近的健康新西兰肉兔,随机分为4组,每组30个重复,每个重复1只.对照组饲喂基础饲粮,试验组(T1、T2、T3组)分别在基础饲粮中添加150、300和450 g/t香芹酚.预试期7 d,生长试验28 d,消化代谢试验7 d.结果表明:1)与对照组相比,T2组的平均日采食量显著降低(P0.05).2)各组之间的干物质(DM)、粗蛋白质(CP)、总能(GE)和酸性洗涤纤维(ADF)表观消
机器译文自动评价是机器翻译中的一个重要任务.针对目前译文自动评价中完全忽略源语言句子信息,仅利用人工参考译文度量翻译质量的不足,该文提出了引入源语言句子信息的机器译文自动评价方法:从机器译文与其源语言句子组成的二元组中提取描述翻译质量的质量向量,并将其与基于语境词向量的译文自动评价方法利用深度神经网络进行融合.在WMT\'19译文自动评价任务数据集上的实验结果表明,该文所提出的方法能有效增强机器译文自动评价与人工评价的相关性.深入的实验分析进一步揭示了源语言句子信息在译文自动评价中发挥着重要作用.
本试验旨在研究饲粮中添加不同水平β-胡萝卜素对母兔生长性能、抗氧化能力、生殖激素指标及卵泡发育的影响.选取55~60日龄、体重[(1.679±0.114)kg]相近、健康状态良好的母兔160只,随机分为4组,每组20个重复,每个重复2只.对照组饲喂基础饲粮,试验组分别在基础饲粮中添加15、30、45 mg/kgβ-胡萝卜素.预试期7 d,正试期84 d.结果表明:1)饲粮中添加不同水平β-胡萝卜素对母兔的终末体重、总增重、平均日增重、平均日采食量以及料重比均无显著影响(P>0.05).2)与对照组相比,饲
该文提出了一种字形相似度计算方法,旨在解决汉字中相似字形(称作形似字)的识别和查找问题.首先,提出了汉字拆分方法,并构建了偏旁部首知识图谱;然后,基于图谱和汉字的结构特点,提出2CTransE模型,学习汉字实体语义信息的表示;最后,将输出的实体向量用于汉字字形的相似度计算,得到 目标汉字的形似字候选集.实验结果表明,该文所提出的方法对于不同结构汉字的字形相似度计算有一定效果,所形成的汉字部件组成库,为之后字形计算的相关研究提供了行之有效的数据集.同时,也拓宽了 日语等类汉语语言文字字体相似度计算的研究思路
本试验旨在揭示桑叶多糖(MLP)对免疫抑制小鼠肠道损伤和微生物多样性的调节作用,初步阐明其作用机制.选择体重(20.0±0.5)g的5周龄雄性BALB/c小鼠60只,随机分为正常对照组(NC组)、环磷酰胺模型组(MC组)、桑叶多糖低剂量组(MLPL组)、桑叶多糖中剂量组(MLPM组)、桑叶多糖高剂量组(MLPH组)和药物对照组(LM组),每组10只小鼠.各组小鼠腹腔注射80 mg/kg BW环磷酰胺(除NC组外),每天1次,连续3 d,以诱导免疫抑制.第4天开始MLPL、MLPM、MLPH和LM组小鼠每天
本试验旨在探讨百里香酚与迷迭香酸组合对脂多糖(LPS)攻毒大鼠生长性能、炎症反应和肠道健康的影响,为百里香酚与迷迭香酸组合在动物生产方面的开发和应用提供参考.试验选取40只21日龄SD大鼠,随机分为4组,分别为对照组(Con组)、百里香酚组(Thy组)、迷迭香酸组(Ros?A组)、百里香酚×迷迭香酸组(Thy×Ros?A组),每组10只(公母各占1/2).Thy组、Ros?A组和Thy×Ros?A组每天分别按照20 mg/kg BW百里香酚、20 mg/kg BW迷迭香酸、10 mg/kg BW百里香酚+
本试验旨在以小鼠为模型探究摄食节律在高脂饲粮(HFD)诱导的代谢综合征(MS)中的作用.将健康的雄性小鼠分为4组,每组5只,连续3个月分别给予含4%脂肪的普通饲粮(Con组)和含10%(10%HFD组)、45%(45%HFD组)、60%(60%HFD组)脂肪的HFD,每周记录小鼠体重,收集血清、肝脏等标本检测生物标志物.为了进一步探究HFD对摄食节律的作用,将另一批小鼠分为Con组与45%HFD组,第1周2组小鼠均饲喂普通饲粮,第2周和第3周Con组继续饲喂普通饲粮,HFD组则饲喂含45%脂肪的HFD,每
话题分割是自然语言处理领域的经典任务之一,其目标是将输入的篇章分割成语义连续的段落.先前的工作使用基于词频、隐式、序列以及Transformer的方法来编码句子,忽略了对篇章整体语义信息的建模.因此,该文采用篇章结构图网络编码句子,获得具有篇章全局信息的句子表示用于话题分割.具体地,该模型首先为每一个篇章单独建图,其中包含篇章的所有句子和单词节点以及它们之间的邻接信息.然后,模型使用门控图神经网络对图进行迭代,得到包含篇章全局信息的句子表示.它们被进一步送入Bi-LSTM层以预测话题分割点.实验结果表明,