【摘 要】
:
该文旨在以HowNet为例,探讨在表示学习模型中引入人工知识库的必要性和有效性。目前词向量多是通过构造神经网络模型,在大规模语料库上无监督训练得到,但这种框架面临两个问
【机 构】
:
清华大学计算机科学与技术系,首都师范大学
【基金项目】
:
国家社会科学基金(13&ZD190), 国家自然科学基金(61133012)
论文部分内容阅读
该文旨在以HowNet为例,探讨在表示学习模型中引入人工知识库的必要性和有效性。目前词向量多是通过构造神经网络模型,在大规模语料库上无监督训练得到,但这种框架面临两个问题:一是低频词的词向量质量难以保证;二是多义词的义项向量无法获得。该文提出了融合HowNet和大规模语料库的义原向量学习神经网络模型,并以义原向量为桥梁,自动得到义项向量及完善词向量。初步的实验结果表明该模型能有效提升在词相似度和词义消歧任务上的性能,有助于低频词和多义词的处理。作者指出,借重于人工知识库的神经网络语言模型应该成为今后一段时
其他文献
柴达木盆地三湖地区第四系浅层生物气一直被认为完全是由第四系腐殖型有机质生成的.最新研究结果表明:(1)第四系生物气藏探明储量与源岩条件之间不匹配;(2)高分辨率地震剖面
摘 要:高考英语作文新题型“读后续写”出现时间不长,但是其重要程度引发了学者们教师们的研究。以浙江高考续写题目要求为例,探讨教学过程中的策略和方法。本文以人教版为主要研究教材版本,探讨如何在一般新课中穿插知识积累,创造力激发等策略,提升学生们的解题能力和提升综合素质。 关键词:新题型;“读后续写”;人教版;英语教学 一、引言 高考英语作文新题型“读后续写”的出现代表了新课标对学生们语言能力更
油气二次运移是成藏的关键,通过对渤海湾埕北断阶区油气二次运移条件及对已发现油气分布特点的分析,总结了该区油气二次运移的主要模式:沿主断层垂直运移;沿不整合面和渗透层侧向
为了研究停输后沿线管内原油的屈服应力分布,采用管输模拟的实验方法,研究了大庆原油在凝点温度附近的屈服特性.结果表明,大庆原油的屈服应力与动冷终温的关系曲线存在一拐点温度