论文部分内容阅读
英语作文自动评分是计算机技术和人工智能技术迅速发展的必然趋势。同时自然语言处理技术使得人类能够与计算机之间有效的沟通,这就使对作文自动评分系统的研究更加有理论基础及可行性。显然,相对于人工评分除了可以减轻教师的负担外,英语作文自动评分更加客观公正、有统一的评分标准、高效的特点。因此,英语作文自动评分是具有实际意义的研究课题。 本文主要以全国大学英语四级和六级考试为背景,对参加全国大学英语四级和六级英语考试学生的作文进行评分。在语料的准备工作中,样本集是由作文的范文组成的,而不是各个分数段的作文,这就减轻了教师在评分前的准备工作。比较潜在语义分析与概率潜在语义分析的优劣,最终利用概率潜在语义分析技术对英语作文的内容进行分析,即语义评分。在原有的概率潜在语义分析的基础上,对传统权重公式加入了文档全局权重,并利用改进的权重公式对语义空间进行改善,从而提高英语作文内容质量的评估的精度。本模型还对英语作文的语义连贯性和可读性进行了分析,并对作文的浅层次语言学特征进行了统计,例如:单词数、句子数、复杂词数等。最终,利用内容质量、语义连贯性、可读性和浅层次语言学特征对英语作文进行综合评分。 通过待评分作文的机器得分与人工评分的比较,实验结果表明本模型是可以胜任评分工作的,并且利用概率潜在语义分析技术和改进的权重公式对改善最后的评分结果是有效的,同时概率潜在语义分析减少了构建语义空间的时间。