中教数据库 > 外语电化教学 > 文章详情

面向大规模英语学习者语料库建设的自动拼写检查研究

更新时间:2023-05-28

【摘要】随着学习者语料库建设规模的不断扩大,语料预处理的自动化需求也愈发迫切。拼写检查是语料预处理中的重要步骤,是后续语料检索及统计分析得以准确进行的前提条件。现有通用自动拼写检查工具并不适于学习者语料库建设。同时,由于学习者拼写错误标注语料数量有限,有监督深度学习模型无法得到应用。针对上述问题,该研究将词向量技术应用于自动拼写检查,结合编辑距离计算以及N-Gram语言模型,设计和构建面向大规模英语学习者语料库建设的自动拼写检查系统。数据测评结果表明,通过词向量增强的自动拼写检查系统在各项主要指标上均超过现有开源自动拼写检查工具,计算效率也能满足语料预处理应用需要。

【关键词】

227 2页 免费

发表评论

登录后发表评论 (已发布 0条)

点亮你的头像 秀出你的观点

0/500
以上留言仅代表用户个人观点,不代表中教立场
相关文献

推荐期刊

Copyright © 2013-2016 ZJHJ Corporation,All Rights Reserved

京ICP备2021021570号-13

京公网安备 11011102000866号