【摘 要】
:
双语术语词典在生物医学跨语言检索系统中有着非常重要的地位,而双语句子对齐是构建双语词典的第一步工作。为了构想面向生物医学领域的双语词典,该文将分类思想和迁移学习方
【基金项目】
:
国家自然科学基金资助项目(60373095 60673039), 国家863高科技计划资助项目(2006AA01Z151), 教育部留学人员归国科研启动基金项目(教外司留[2007]118号), 国家社科基金资助项目(08BTQ025)
论文部分内容阅读
双语术语词典在生物医学跨语言检索系统中有着非常重要的地位,而双语句子对齐是构建双语词典的第一步工作。为了构想面向生物医学领域的双语词典,该文将分类思想和迁移学习方法引入汉英句子对齐任务中,将句子对齐任务看成一个多类分类任务,考虑生物医学领域双语摘要的锚信息,利用高斯混合模型完成分类目标。同时,在模型训练过程中,该文引入了迁移学习的思想,结合无噪音的《新概念英语》双语语料对模型的句子长度特征进行训练,使得模型在测试语料上句子对齐的正确率得到较大提高。
其他文献
【摘要】:作为数学教师在培养小学生的独立思考能力时,应该从以下几个方面着手:在平时的教学中,要充分利用课堂教学注重培养学生的独立思考能力;课内外作业要有利于培养学生的独立思考能力;用冥想和画思维导图来培养学生的独立思考能力;让学生掌握独立思考的本领,在终身学习中发挥作用。 【关键词】:独立思考能力 课内外作业 思维导图人要获得一点知识,需要独立思考。人要有所发现有所发明有所创造,更得依赖独立思考
在基于短语的汉蒙统计机器翻译系统的研究中,我们发现存在着严重的语序错误。该文在对汉语和蒙古语句子语序进行研究的基础上,提出了基于蒙古语语序的汉语句子调序方法;同时
该文研究论坛的增量搜集问题。由于在论坛中同一主题通常分布在多个页面上,而传统增量搜集技术的抓取策略通常是基于单个页面,因此这些技术并不适于对论坛增量搜集。该文通过对