基于机器学习的汉语作文语法错误检测方法研究及其应用

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:yc253
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉语作为一种重要的交际工具逐步被世界各国人民所认可,在学习汉语的过程中,写作被许多研究者认为是评价语言学习者学习效果最有效的工具之一,但人工批改汉语作文需要大量的人力,且需要耗费较长时间,不能给语言学习者及时有效的反馈和分析。而且,汉语本身的复杂性也给人工批改增加了难度。本文旨在构建能够检测出汉语语法错误的机器学习算法模型,并将所训练出的模型应用于汉语作文语法检测系统中,以节约大量人工批阅作文的时间和人力成本,将教师从繁重而重复的评价活动中解放,与此同时使学习者能较快地得到及时客观的反馈,清晰地了解到自己在汉语学习中易犯的语法错误,对汉语学习者的自主学习起到了一定辅助作用。本文以理论和实践相结合,探索基于机器学习的汉语语法检测方法及其应用。具体工作包括(1)通过对文献进行定性数据分析,揭示近年来教育领域中不同机器学习模型的使用频次和变化趋势。(2)通过国内外研究综述,对语法检测的常用策略进行了归纳分类。(3)构建了条件随机场模型、LSTM-CRF模型和多任务学习模型这三个不同的机器学习算法模型进行汉语语法检测,并对三个模型进行评估分析,选出了效果最优的模型。(4)设计并开发了汉语作文语法检测系统,将算法模型应用于系统中。近年来,在人工智能的教育应用中,基于神经网络算法模型的占比明显高于其他方法,得到了越来越广泛的应用。在语法检测这一特定任务中,研究者们也逐渐将视线从原先基于统计的方法转移到了基于神经网络的方法。在本文构建的三个算法模型中,多任务学习模型的表现优于条件随机场模型和LSTM-CRF模型,原因是包含辅助任务的多任务学习模型从一定程度上解决了数据稀疏的问题,使得模型在标签分布不均匀的情况下也能得到较充分地训练,从而在语法错误检测任务中比其他模型有更好的表现。
其他文献
本文是一篇翻译报告,翻译项目选自美国罗格斯新泽西州立大学的教授米古尔·吉梅内斯—克雷斯波(Miguel Jimenez-Crespo)撰写的《翻译与网络本地化》(Translation and Web Loc
通过田间小区试验和微区筒15N示踪试验对垄作表层施肥(垄面下l~2cm土层处施肥)、垄作中层施肥(垄面下25cm土层处施肥)、垄作底层施肥(垄面下45cm土层处施肥)和平作表层施肥(常规耕作,1
目的:探讨孕妇体操配合拉玛泽呼吸训练对分娩方式及情绪状态的影响。方法:210例孕妇分为试验组和对照组,对照组进行常规产前检查,试验组在对照组基础上实施孕妇体操及拉玛泽呼吸
目的:观察综合疗法治疗踝关节周围骨折所致踝关节功能障碍的疗效。方法:105例患者均运用理疗、运动疗法、关节松动训练等治疗手段改善踝关节功能,比较治疗前后患者踝关节背屈及
国防科技信息属于科技信息范畴。其主要职能是在军事装备建设领域中,运用科学的方法和现代信息技术手段,对与装备建设有关的国内外科技信息进行搜集、加工处理、分析研究,为
文章对住房制度改革后住房维修基金问题进行了探讨,主要内容有:1.建立住房维修基金的意义;2.住房维修基金的特征;3.住房维修基金的筹集渠道;4.住房维修基金的管理四个方面。
目的:探讨早期康复训练结合针灸对中风患者认知功能与生活质量的影响。方法:70例中风患者纳入研究,分为早期康复训练结合针灸的观察组及单纯针灸的对照组,疗程结束后进行认知功能
目的:研究老年慢性病患者接受门诊护理干预的临床效果。方法:2013年3月-2013年10月我院门诊部老年慢性病患者400例随机分为对照组与观察组各200例,对照组未实施门诊护理干预,观察